Daglig oppsummering: OpenAI lanserer GPT-5.3-Codex, mest kapabel agentisk kodingsmodell, mens Codex App når 1 million nedlastinger
OpenAI lanserer GPT-5.3-Codex, mest kapabel agentisk kodingsmodell, mens Codex App når 1 million nedlastinger. Perplexity oppgraderer Deep Research til Anthropics Claude Opus 4.6, hevder benchmark-lederskap. X ruller ut.
OpenAI lanserer GPT-5.3-Codex, mest kapabel agentisk kodingsmodell, mens Codex App når 1 million nedlastinger
OpenAI slapp GPT-5.3-Codex 5. februar, deres mest avanserte agentiske kodingsmodell til nå, bygget videre på GPT-5.2 med 25 % raskere inferens og toppbenchmarks som 56,8 % på SWE-Bench Pro og 77,3 % på Terminal-Bench 2.0.[1] Den håndterer hele programvarelivssyklusen, fra autonom utvikling av apper og spill til herding av cybersikkerhet – og tjente den første «High capability»-vurderingen, komplett med 10 millioner dollar i API-kreditter for kyberforsvar.[1] Modellen hjalp til og med med å skape seg selv, ifølge OpenAIs frekke sitat.[1]
Den nye Codex App, lansert 2. februar, nådde over 1 million nedlastinger i første uke med 60 % uke-over-uke brukerøkning, nå tilgjengelig i CLI, Cursor, GitHub og VS Code.[2][3] Den er midlertidig gratis for ChatGPT Free/Go-brukere, med Sam Altman som signaliserer planer om å holde den tilgjengelig etter promo-perioden.[3] X bruser med virale demoer av dens agentiske bragder, som pumper opp entusiasmen for økt utviklerproduktivitet.
Perplexity oppgraderer Deep Research til Anthropics Claude Opus 4.6, hevder benchmark-lederskap
Anthropic avduket Claude Opus 4.6 5. februar, med oppgraderinger i koding, agentisk planlegging og et 1M-token kontekstvindu i beta, som dominerer benchmarks som Terminal-Bench 2.0 SOTA, 90,2 % på BigLaw Bench, og lederskap i GDPval over GPT-5.2.[4] Perplexity lot ikke vente på seg, og oppgraderte Deep Research for Max-brukere (167 $/mnd) umiddelbart, med utrulling til Pro kort tid etter, og skrøt av SOTA på Googles DSQA og interne tester med adaptiv tenkning og høyere utdatatokens.[5][6]
Perplexitys trekk lover dypere forskningskapasiteter, som de hevder: «Perplexity Deep Research kjører nå på Opus 4.6, og forbedrer våre eksisterende state-of-the-art-resultater.»[6] Max-brukere på X roper allerede hurra for umiddelbar tilgang og forbedrede utganger, og utløser diskusjoner om at Perplexity trekker fra i benchmark-krigen.
X ruller ut viral Grok-tematisert animasjon for like-knappen
X snudde like-knappen til et skue rundt 9. februar, som utløser en gigantisk Grok-logo-animasjon ved trykk – en midlertidig gimmick som får brukere til å spamme likes for å vise den frem.[7][8][9] Det gjentar tidligere suksesser som SpaceX-rakett-effekten, og driver massiv engasjement i løpet av timer, med videoer som flommer feedene.
Reaksjonene på X er ren hype: folk roper «Trykk på ❤️-knappen og se!» og takker teamet før det forsvinner, og forvandler hverdagslikes til en viral fest.
Elon Musk advarer om «woke virus» i KI, prioriterer maksimalt sannhetssøkende KI for sikkerhet
Elon Musk dukket opp igjen i en viral klipp, og slo ned på «woke virus» i KI som en misalignment-risiko verre enn HAL fra 2001: En romodyssé, og presset for «maksimalt sannhetssøkende KI» som det ultimate sikkerhetstrekket.[10][11] «Min største bekymring for KI-sikkerhet er at vi trenger en maksimalt sannhetssøkende KI... Det er svært viktig å ha sannhet,» sa han, og vekket liv i TruthGPT-korstoget mot biasede modeller.
X gløder med delinger og debatter om sannhet vs. politisk korrekthet i alignment, og understreker pågående spenninger i KI-etikk.
Hva dette betyr for bedriften din
Agentiske modeller som GPT-5.3-Codex og Claude Opus 4.6 superlader koding og forskning, men rå kraft alene gir ikke resultater – arbeidsflytene dine trenger smart orkestrering for å unngå kaos. Hos Up North AI forvandler vår multi-agent orkestrering (MCP/A2A) og agent-arbeidskraftdesign disse verktøyene til pålitelige team, som håndterer hele livssykluser fra utvikling til kyberforsvar uten hype-tretthet.
Elons oppfordring til sannhetssøking og Xs Grok-moro belyser tillitsgap: biased eller flashy KI undergraver resultater. Vi spesialiserer oss i KI-kvalitet & tillitsgjennomgang for å audite for alignment, pluss utfallsteknikk for å sikre forretnings-ROI. Kode er gratis. Bedømmelse er det ikke.
Hovedpoeng: Prioriter orkestrerte agenter og rigorøse tillitsgjennomganger nå for å utnytte disse sprangene uten fallgruvene – før konkurrentene gjør det.
Kilder
- https://openai.com/index/introducing-gpt-5-3-codex
- https://openai.com/index/introducing-the-codex-app
- https://venturebeat.com/technology/openais-new-codex-app-hits-1m-downloads-in-first-week-but-limits-may-be
- https://www.anthropic.com/news/claude-opus-4-6
- https://www.perplexity.ai/pro
- https://www.threads.com/@perplexity/post/DUWOU4dAT5E
- https://x.com/suresh_maurya_/status/2020712232712343724
- https://x.com/anandchokshi19/status/2020690240395256178
- https://x.com/RoRoFli/status/2020960792938451452
- https://x.com/XFreeze/status/2020738262432637398
- https://www.facebook.com/calfkickercom1/posts/elon-musk-discusses-the-potential-dangers-of-artificial-intelligence-development/1491016953027712
Hold deg oppdatert om AI
Ingen spam. Meld deg av når som helst.
Trenger du hjelp med å forstå AI?
Å lese nyheter er én ting. Å vite hva du skal gjøre med det er en annen. Vi hjelper bedrifter med å omsette AI-trender til handling.