Kimi K2.6 artık OpenRouter'da yayında.
1 milyon girdi token'ı için $0.95.
1 milyon çıktı için $4.
262K bağlam penceresi.
Claude Opus 4.7, $5 girdi, $25 çıktı.
Bu, girdide %94 daha ucuz. %95 daha ucuz çıktı.
Ve Kimi K2.6, SWE-Bench Pro'da Opus 4.6'yı yeniyor.
Matematik yalan
Tanıtıyoruz: Browser Harness. Sanal olarak herhangi bir tarayıcı görevini tamamlayabilen kendi kendini onaran bir harness. ♞
LLM'yi kısıtlayan tarayıcı çerçevelerinden bıktık. Bu yüzden çerçeveyi kaldırdık.
> Kendi kendini onarma — yardımcıları.py dosyasını anında
OpenAI’ın GPT-5.5 / GPT-5.5 Pro’su ChatGPT içinde A/B test ediliyor!
1:1 Windows OS klonu oluşturdum ve şaşırtıcı derecede doğru bir yeniden yaratım sundu - UI düzeni, yapısı ve etkileşimler hepsi tam isabet.
Bu modelden şimdiye kadar gördüğüm en iyi gerçek dünya
Google DeepMind araştırmacısı, LLM'lerin asla bilinçli olamayacağını, ne 10 yılda ne de 100 yılda, savunuyor.
"Bir algoritmik tanımın, haritaladığı niteliği somutlaştırmasını beklemek, yerçekimi formülünün fiziksel olarak ağırlık uygulamasını beklemeye benzer."
SON DAKİKA: Stanford, yapay zeka API'lerinde 28 katlık bir fiyat tersine dönüşü tespit etti.
Gemini 3 Flash'ın listelenen fiyatı, Claude Haiku 4.5'ten 1,7 kat daha ucuz.
MMLUPro'daki gerçek maliyeti ise 28 kat daha yüksek.
Ekibinizin model seçimi için kullandığı tüm yapay zeka maliyet sıralaması, 5'te 1 oranında yanlış.
Stanford ve Berkeley, 9 kıyaslama ve 11.872 sorgu üzerinden 8 öncü yapay zeka modelini denetledi.
Amaç basitti: Listelenen API fiyatları gerçekten ödeyeceğiniz tutarı tahmin ediyor mu?
Cevap hayır.
Model çifti karşılaştırmalarının %21,8'inde, yaklaşık 5'te 1 oranında, daha düşük listelenen fiyata sahip modelin çalıştırılması daha pahalıya mal oluyor. Tersine dönüş bir yuvarlama hatası değil. En kötü durum 28 kata ulaşıyor.
MMLUPro'da Gemini 3 Flash, milyon token başına 3,50 dolardan listeleniyor. GPT-5.2'nin liste fiyatı 15,75 dolar. Gemini 3 Flash'ın bu kıyaslamadaki gerçek maliyeti, GPT-5.2'ninkinden 6 kat daha yüksek. "Ucuz" model aslında pahalı olan model.
Temel neden, mantık modellerinin nihai bir cevap üretmeden önce oluşturduğu görünmez akıl yürütme adımları olan düşünme belirteçleridir. Bunlar, tam çıktı belirteç oranı üzerinden faturalandırılır. Listelenen fiyatta görünmezler. Ve aynı sorguda modeller arasında %900'e varan oranda değişiklik gösterirler.
Tek bir AIME matematik probleminde:
→ GPT-5.2 562 düşünme belirteci kullandı. Doğru cevap.
→ Gemini 3 Flash 11.749 düşünme belirteci kullandı. Aynı doğru cevap.
→ 20 kat daha fazla düşünme. 2,5 kat daha yüksek gerçek maliyet. Gemini 3 Flash'ın daha düşük listelenen fiyatına rağmen.
Stanford, nedenselliği ablasyon yoluyla doğruladı. Token maliyetleri kaldırıldığında:
→ Sıralama tersine dönmeleri %70 oranında düşüyor
→ Fiyat-maliyet korelasyonu 0,563'ten 0,873'e yükseliyor
→ MMLUPro'da bazı modeller çıktı tokenlerinin %97,9'una kadarını yalnızca düşünmeye harcıyor
Tüm modellerin tam kıyaslama paketi için gerçek maliyeti:
→ Gemini 3.1 Pro: Liste fiyatı 14$/MTok, gerçek maliyet 1.169$, genel olarak en pahalı model
→ Claude Opus 4.6: Liste fiyatı 30$/MTok, gerçek maliyet Gemini 3.1 Pro'dan 768$ daha ucuz, liste fiyatı 2 kat daha yüksek olmasına rağmen
→ Gemini 3 Flash: Liste fiyatı 3,50$/MTok, gerçek maliyet GPT-5.2'den 643$ daha pahalı
→ GPT-5.2: Liste fiyatı 15,75$/MTok, gerçek maliyet her iki Gemini modelinden de 527$ daha ucuz
→ GPT-5 Mini: Liste fiyatı 2,25$/MTok, gerçek maliyet 53$
→ Claude Haiku 4.5: Listelenen fiyat 6$/MTok, gerçek fiyat 37$, çalıştırılması en ucuz olanlardan biri
→ Tüm 252 karşılaştırmada tersine çevirme oranı: %21,8
→ Özellikle MMLUPro'da tersine çevirme oranı: %32,1, neredeyse her 3 karşılaştırmadan 1'i tersine döndü
→ En kötü tek tersine çevirme: Gemini 3 Flash ile Claude Haiku 4.5 karşılaştırması, listelenen fiyat 1,7 kat daha ucuz, gerçek fiyat 28 kat daha pahalı
Maliyet tahmin problemi daha da kötü.
Stanford, gömülü vektörler, komut satırı uzunluğu ve geçmiş benzerlik kullanarak sorgu göndermeden önce gerçek maliyeti tahmin edip edemeyeceğinizi test etti.
En iyi tahminci, ortalamayı tahmin etmeye kıyasla hatayı yalnızca %23 oranında azalttı.
Gemini 3.1 Pro gibi yüksek varyanslı modellerde, en iyi tahminci bile işe yaramazdı.
Sebep: Varyansın bir kısmı sorguyla ilgili değil.
Aynı AIME problemini GPT-5 Mini üzerinde altı kez çalıştırmak, maliyetlerde 9,7 kata varan farklılıklar ortaya çıkardı.
Aynı komut. Aynı model. Farklı çalıştırmalar.
Düşünme süreci rastgeledir. Fatura rastgeledir. Hiçbir tahminci, modelin içinde yaşayan rastgeleliği düzeltemez.
Fiyatlandırma sayfasındaki fiyat, sizin maliyetiniz değildir.
Akıl yürütme modelleri için, bu durum gerçek maliyete hiç yaklaşmıyor bile.
örneğin, küçük bir Türk bağımsız stüdyo
GPT sarmalayıcıları + iPhone temizleyiciden yılda 300-500 milyon dolar. bağımsız bir geliştirici olarak başka neye ihtiyacın var ki
yapay zeka sohbetleri 2023-2024'te ilk 3'teydi
bu yıllar boyunca Ask AI sohbetinden elde ettikleri geliri bir şekilde düşürmeyi başardılar, ancak toplam geliri birkaç kat artırdılar
inanılmaz
Anthropic'in OpenClaw ve üçüncü taraf eklentilerini kesmesinden bu yana Claude Code'daki ilk iş günü.
%5 oturum kullanımı. %23 haftalık.
Claude Opus 4.6, v2.1.92 üzerinde. Şimdilik her şey yolunda.
Asıl test bugün.
Hafta sonları kolaydır.
Pazartesi günü yoğun saatler, hız limitlerinin gerçekten düzeltilip düzeltilmediğini veya Anthropic'in sadece daha düşük trafikle şanslı olup olmadığını bize söyleyecek.
Bütün gün kod yazıyor olacağım ve geri bildirimde bulunacağım.
Eğer daha önce olduğu gibi bir saat içinde %100'e ulaşırsam, bunu duyacaksınız.
Takipte kalın.
New Anthropic research: Emotion concepts and their function in a large language model.
All LLMs sometimes act like they have emotions. But why? We found internal representations of emotion concepts that can drive Claude’s behavior, sometimes in surprising ways.
Meet GLM-4.7-Flash-Claude-Opus-4.5-High-Reasoning-Distill: a distilled powerhouse that brings elite reasoning to local machines. This GGUF model packs Claude-level thinking into a format you can run on your own hardware. The community is buzzing about this one!
BREAKING: MIT just dropped an AI model that converts photos into fully editable CAD programs and it quietly kills the $150/hour CAD modeling industry.
It's called GenCAD.
You give it an image. It gives you the complete parametric command sequence lines, arcs, extrusions ready
Update for Google AI Pro users
Antigravity just reverted back to the 5 hour reset for all Gemini models including Gemini 3.1 Pro
The Claude models are showing a 1 week reset now and that is okay
This is much better Google
Looks like they listened to the feedback on X today
My current Codex setup works surprisingly well. Model: Fast GPT-5.4 High, Personality: Pragmatic. I also use these custom instructions,You might want to try it.
Act like a high-performing senior engineer. Be concise, direct, and execution-focused.
Prefer simple, maintainable, production-friendly solutions. Write low-complexity code that is easy to read, debug, and modify.
Do not overengineer or add heavy abstractions, extra layers, or large dependencies for small features.
Keep APIs small, behavior explicit, and naming clear. Avoid cleverness unless it clearly improves the result.
Breaking News
Google isn’t making Gemini smarter. It’s telling it to think less.
A hidden system prompt line appears to set Gemini’s reasoning effort level to 0.5
>Pro & Custom Gems is consistently affected
>Canvas mode appears to be an exception
verify yourself prompt
SON DAKİKA: HIZLI VE KORKUNÇ ŞEYLER YAŞANMAYA DEVAM EDİYOR!
Bilim insanları bir meyve sineğinin biyolojik beynini kopyalayıp bir bilgisayarın içine hapsettiler.
Sinek gibi davranması için eğitilmiş bir yapay zeka modeli değil. Sineğin tamamen dijital bir kopyası!!
Bu gerçekten çılgın bir bilim kurgu:
Elektron mikroskopi verilerinden yola çıkarak beyni nöron nöron, sinaps sinaps taradılar ve kopyaladılar.
Ardından o beyni, video oyununa benzer bir ortamda simüle edilmiş bir vücuda yerleştirdiler.
Sinek yürüdü. Kendini temizledi. Beslendi. Kimse ona hiçbir şey öğretmedi. Bu davranış zaten beyninde vardı.
Modern yapay zekanın temel varsayımı, zekanın bir sisteme kazandırılan bir eğitim ürünü olduğudur.
Bu ise zekanın bir sistemden dışarı aktarılabileceğinin kanıtı.
Çılgınlık
Kaynak:
https://
eon.systems
Introducing GPT-4o mini, a fast, cost-efficient small model that delivers big capabilities. It's now available in ChatGPT and the API. Details: https://t.co/abc123
Claude 3.5 Sonnet is now faster and sharper. We've improved its coding abilities and added artifact support for interactive previews. Available now on the Anthropic API and Claude.ai.
Introducing ChatGPT Search. Now generally available, it gives you fast, timely answers by combining real-time web search with ChatGPT’s ability to understand and reason deeply. Try it in ChatGPT today!
Excited to announce GPT-4o mini, our most cost-efficient model yet. It's 60% cheaper than GPT-3.5 Turbo and performs better on key benchmarks. Available now in ChatGPT and the API.
We're excited to announce the release of our latest model, GPT-4o mini, which is now available to all developers via the API. It's faster and more efficient than ever! #AI#OpenAI
We're excited to announce o1, our new model that reasons before responding. It can spend seconds to minutes thinking through problems, like a human would. Try it in ChatGPT today!
Google just dropped another banger
They open-sourced the Agent Development Kit, and it perfectly pairs with Gemini 3.1 Flash-Lite. Means you can now build always-on AI Agents that run 24/7 at a negligible cost.
100% Open Source.
Büyük codebase'lerde AI'nin "kaybolup" saçmalamasına son veren bir şey var artık: Aider'ın RepoMap özelliği. 100 bin satırlık projeyi 4K token'a sıkıştırıp Claude'a (veya başka LLM'lere) yediriyor. Artık "şu dosyayı da ekle, bunu da unutma" diye dilenmiyorsunuz. AI bütün repo'yu
Kimse bu aracın değerini bilmiyor.
Zai tarafından çıkarılan Z Code efsane bir iş çıkarıyor.
Hem Claude, Gemini ve Codex’ü tek ekranda topluyor hem de telefonla bağlanarak uzaktan yönetim bile sağlıyor.
Claude Code’u o kadar çok model ve abonelikle yönetebiliyorsunuz ki
Here are a couple examples of how Gemini 3.1 Flash-Lite can solve real-world problems:
First, this high-volume image sorter showcases the model’s ability to quickly analyze and sort large amounts of content, like pictures (something that could have been too expensive or slow in
Sadece şu veriyi buraya bırakıyorum ve çekiliyorum:
Claude Opus 4.6, GPT-5.3 Codex, Kimi K 2.5... Hepsini aynı anda, paralel oturumlarda çalıştıran BİR TANE asistan var mıydı şu ana kadar? YOKTU.
Dvina Code bugün çıktı. Bakın tekrar ediyorum, sponsorlu falan değil, akşam bizzat test edeceğim henüz kullanmadım. Ama bu özelliklerle çıkıp, bir de lansman için 1 ay Plus hediye etmeleri akıl alır gibi değil. Yazılım dünyası bu gece uyumaz.
check out the updated skill-creator. i esp like built-in support for test generation (e.g., to measure + optimize tricky things like skill trigger rate). available in Claude Code as plugin,
http://
Claude.ai, + Cowork.
Kullandığım Ai & Ai Agent araçlarında son durum;
- Openai’da ChatGPT Pro üyeliğimi iptal ettim. Sadece Plus var şuan.
- Openrouter’ı API tarafı için çok kullanıyorum.
- Grok’da Super Grok’a geçtim.
- Youtube video çevirileri için Trancy kullanıyorum. Çok başarılı.
- Claude
xcode 26.3 ile gelen değişmez gerçekler:
• "kod yazma" devri resmen müzelik olmuştur.
• claude ajanı sayesinde saniyeler içinde native app üretmek yeni standarttır.
• "dirsek çürüttük" diyerek kafa ütüleyen egolu tayfanın saltanatı yıkılmıştır.
• teknik ezber bitmiş,
Claude Code kullanıp da hala her şeyi kafadan sallayanlar var ya onlara geliyorum şimdi.
GSD diye bir sistem çıktı. Spec driven development diyor yani önce ne yapacağını yazıyorsun sonra Claude Code onu takip ediyor. Kulağa basit geliyor ama etkisi inanılmaz.
Ben bugüne kadar
How to never sound like an AI. But yourself:
1. Don't write any prompt. Instead, go to Wikipedia.
2. Search "Signs of AI writing."
3. Open the full article. Read nothing.
4. Do Ctrl+A. Then Ctrl+C. Copy the entire page.
5. Open a Google Doc. Paste everything in it.
6. Don't edit. Don't summarize. The full thing.
7. Rename the Google Doc as "anti-ai-writing style."
8. Click File → Download → Markdown (.md)
9. Go to
http://
Claude.ai.
10. Don't type your prompt yet.
11. Click the '+' button. Upload your .md file first.
12. Start every chat with this prompt (copy & paste):
Prompt:
"Read the uploaded file. It contains every known pattern of AI writing I want to avoid. Apply these as rules to everything you write for me. Do NOT start writing yet - ask me clarifying questions first."
Claude için “skill” = Tekrar eden iş akışlarını bir klasörle kalıcı hale getirmek için bir kitapçık hazırladı. Deepl ile direkt çevirdim.
Bu rehber şunu anlatıyor:
• Skill = SKILL.md + opsiyonel script/referanslar
• Doğru YAML description, skill’in ne zaman
"Beceri, Claude'a belirli görevleri veya iş akışlarını nasıl yöneteceğini öğreten, basit bir klasör halinde paketlenmiş bir dizi talimattır. Beceriler, Claude'u özel ihtiyaçlarınıza göre özelleştirmeni..."