Up North
Til baka í fréttir

Daglegt yfirlit: OpenAI gefur út GPT-5.3-Codex, öflugasta agentíska kóðunarmódelið hingað til, þegar Codex App nær 1M niðurhlaupum

OpenAI gefur út GPT-5.3-Codex, öflugasta agentíska kóðunarmódelið hingað til, þegar Codex App nær 1M niðurhlaupum. Perplexity uppfærir Deep Research í Anthropic's Claude Opus 4.6, fullyrðir forystu í benchmarkum. X rúllar út.

orchestrationsafetyagentsMCPA2A

OpenAI gefur út GPT-5.3-Codex, öflugasta agentíska kóðunarmódelið hingað til, þegar Codex App nær 1M niðurhlaupum

OpenAI sleppir GPT-5.3-Codex þann 5. febrúar, flóknasta agentíska kóðunarmódelið hingað til, byggt á GPT-5.2 með 25% hraðari inference og top benchmarks eins og 56,8% á SWE-Bench Pro og 77,3% á Terminal-Bench 2.0.[1] Það sér um heildar hugbúnaðarlífsferilinn, frá sjálfstæðri smíði forrita og leikja til styrkingar cybersecurity—fær fyrstu „High capability“ einkunn, ásamt $10M í API kredítum fyrir cyber defense.[1] Mödelið hjálpaði jafnvel til við að búa sig sjálft til, samkvæmt freku tilvitnun OpenAI.[1]

Nýja Codex App, gefið út 2. febrúar, náði yfir 1M niðurhlaupum í fyrstu viku með 60% vöxt notenda vikna á viku, nú fáanlegt í CLI, Cursor, GitHub og VS Code.[2][3] Það er tímabundið ókeypis fyrir ChatGPT Free/Go notendur, með Sam Altman að gefa til kynna áform um að halda því aðgengilegu eftir auglýsinguna.[3] X er að sorða af veiru-démóum af agentíska afrekum þess, sem ýtir undir spenning fyrir auknum dev framleiðni.

Perplexity uppfærir Deep Research í Anthropic's Claude Opus 4.6, fullyrðir forystu í benchmarkum

Anthropic kynnti Claude Opus 4.6 þann 5. febrúar, pakkað með uppfærslum í kóðun, agentískri skipulagningu og 1M-token samhengisglugga í beta, ríkir yfir benchmarkum eins og Terminal-Bench 2.0 SOTA, 90,2% á BigLaw Bench og forystu í GDPval yfir GPT-5.2.[4] Perplexity beið ekki, uppfærði Deep Research fyrir Max notendur ($167/mán) strax, rúllaði út til Pro stuttu síðar, hrömmaði SOTA á Google's DSQA og innri verkfærum með adaptive thinking og hærri output tokens.[5][6]

Uppfærslan frá Perplexity lofar dýpri rannsóknar getu, eins og þeir fullyrða: „Perplexity Deep Research keyrir nú á Opus 4.6, bætir við núverandi state-of-the-art niðurstöðum okkar.“[6] Max notendur á X eru þegar að hrósa strax aðgangi og bættum úttakum, sem kveikir umræður um að Perplexity nái forystu í benchmark stríðunum.

X rúllar út veiru-Grok þemaða hreyfingu fyrir like hnappinn

X breytti like hnippmynstri í skemmtun um 9. febrúar, ræsir risastórt Grok logo hreyfingu við smell— tímabundinn gimmick sem fær notendur til að spam like til að sýna það fram.[7][8][9] Endirheitar fyrri hite eins og SpaceX eldflaugar áhrifin, ýtir undir gríðarlegt engagement á stundum, með myndskeiðum að flæða inn í strauma.

Viðbrögð á X eru hrein hype: fólk öskrar „Sláðu á ❤️ hnappinn og sjáðu!“ og þakkar liðinu áður en það hverfur, breytir venjulegum like í veiru-fjörbúð.

Elon Musk varar við 'woke virus' í AI, forgangsraðar hámarks sannleikssækandi AI fyrir öryggi

Elon Musk birtist aftur í veiru-klippi, hamrar á „woke virus“ í AI sem áhættu á villuleiðréttingu verri en HAL úr 2001: A Space Odyssey, ýtir á „maximally truth-seeking AI“ sem ultimate öryggisleik.[10][11] „Mesta áhyggju mín af AI öryggi er að við þurfum maximally truth-seeking AI... Það er mjög mikilvægt að hafa sannleikann,“ sagði hann, endurvekur TruthGPT herferð sína gegn bitaðari mödelum.

X er logandi af deilingum og umræðum um sannleika gegn pólitískri réttleika í alignment, undirstrikar áframhaldandi spennu í AI siðfræði.

Hvað þetta þýðir fyrir fyrirtækið þitt

Agentísk mödel eins og GPT-5.3-Codex og Claude Opus 4.6 eru að ofurmelta kóðun og rannsóknir, en hrá kraftur einn mun ekki skila—vinnuflæðin þín þarf snjalla stjórnun til að forðast ringulreið. Hjá Up North AI breytum við multi-agent stjórnun (MCP/A2A) og agent vinnuaflahönnun þessar verkfæri í áreiðanleg lið, sem sér um heildar lífsferla frá dev til cyber defense án hype þreytu.

Kall Elons um sannleikssæki og Grok skemmtun X sýna traustsbil: bitað eða glansandi AI eyðir niðurstöðum. Við sérhæfum oss í AI gæði & traust endurskoðun til að meta alignment, ásamt outcome engineering til að tryggja business ROI. Kóði er ókeypis. Dómur er það ekki.

Lykilatriði: Forgangsraðaðu stýrðu agentum og stranglegum traust endurskoðunum núna til að nýta þessi stökk án gildranna—áður en samkeppnisaðilar gera það.

Heimildir

  1. https://openai.com/index/introducing-gpt-5-3-codex
  2. https://openai.com/index/introducing-the-codex-app
  3. https://venturebeat.com/technology/openais-new-codex-app-hits-1m-downloads-in-first-week-but-limits-may-be
  4. https://www.anthropic.com/news/claude-opus-4-6
  5. https://www.perplexity.ai/pro
  6. https://www.threads.com/@perplexity/post/DUWOU4dAT5E
  7. https://x.com/suresh_maurya_/status/2020712232712343724
  8. https://x.com/anandchokshi19/status/2020690240395256178
  9. https://x.com/RoRoFli/status/2020960792938451452
  10. https://x.com/XFreeze/status/2020738262432637398
  11. https://www.facebook.com/calfkickercom1/posts/elon-musk-discusses-the-potential-dangers-of-artificial-intelligence-development/1491016953027712

Vertu upplýst um AI

Enginn ruslpóstur. Hætta við áskrift hvenær sem er.

Þarftu hjálp við að skilja gervigreind?

Að lesa fréttir er eitt. Að vita hvað á að gera við þær er annað. Við hjálpum fyrirtækjum að breyta gervigreindarþróun í aðgerðir.