Daglig oppsummering: OpenAIs interne modeller lykkes med seks av ti 'First Proof'-problemer på forskernivå i matematikk
OpenAIs interne modeller lykkes med seks av ti 'First Proof'-problemer på forskernivå i matematikk. OpenAIs GPT-5.2 utleder nytt gluoninteraksjonsresultat i teoretisk fysikk-preprint. US Department of Labor.
OpenAIs interne modeller lykkes med seks av ti 'First Proof'-problemer på forskernivå i matematikk
OpenAIs interne modeller tok seg av ti upubliserte matematikkproblemer på forskernivå kjent som «First Proof»-utfordringene, designet for å teste AIs evne til å generere nye bevis. I en sprint på én uke med minimalt menneskelig tilsyn leverte modellene lovende løsninger til minst seks, som eksperter anser som sannsynlig korrekte. Dette markerer et sprang fra grunnleggende matteferdigheter til banebrytende forskning, som fremhevet av Sam Altman.[1][2][3]
Altman kalte det en nøkkeltest for neste generasjons AI, mens OpenAIs sjefvitenskapsmann bemerket 6/10 suksessraten. Sebastien Bubeck delte utfordringen offentlig for å benchmarke systemer, og reaksjonene på X eksploderte – Greg Brockman gjentok entusiasmen, med noen brukere som hyller det som et «AGI oppnådd internt»-øyeblikk.[1][2][3]
OpenAIs GPT-5.2 utleder nytt gluoninteraksjonsresultat i teoretisk fysikk-preprint
- februar medforfattet GPT-5.2 en preprint med forskere fra IAS, Vanderbilt, Cambridge og Harvard, der de foreslo en lukket formel for «single-minus»-gluon-tre-amplituder – interaksjoner lenge antatt å være null i lærebøker. En intern OpenAI-modell beviste det, med mennesker som verifiserte opp til n=6 tilfeller. Resultatet avdekker ikke-nulle amplituder under spesifikke forhold som all-plus-helisitet for andre gluoner, noe som potensielt forenkler beregninger i kvantefeltteori.[4][5][6]
OpenAI delte nyheten på X og understreket hvordan GPT-5.2 utfordret antakelser: en gluoninteraksjon «mange fysikere forventet ikke skulle inntreffe, kan oppstå under spesifikke forhold». Kevin Weil bemerket tiår gamle antakelser som veltes, og Bo Wang (@BoWang87) spøkte med at GPT-5.2 egentlig sa: «Hva om de kan – under disse forholdene?»[5][6]
US Department of Labor slipper landets første nasjonale rammeverk for AI-kompetanse
US Department of Labor lanserte nasjonens første rammeverk for AI-kompetanse 13. februar, som skisserer kjerneinnholdsområder og leveringsprinsipper for AI-utdanning. Det knytter seg til Det hvite hus’ America's AI Action Plan fra juli 2025, og kanaliserer finansiering fra Workforce Innovation mot AI-kompetanseprogrammer med mål om å lede global AI-utrulling på en måte som skiller seg fra EU-regler.[7][8][9]
Mens reaksjonene på X var dempet blant de store navnene, fremhever diskusjoner ringvirkningene for K-12 og utover, og posisjonerer USA til å forme normer for AI-kompetanse i motsetning til EU AI Acts strengere tilnærming.[7][8][9]
Hva dette betyr for virksomheten din
OpenAIs gjennombrudd i matematikkbevis og fysikkavledninger signaliserer at AI krysser inn i ekte vitenskapelig oppdagelse – utover mønster-matching til generering av nye hypoteser. For nordiske selskaper understreker dette behovet for design av agent-arbeidskraft og multi-agent-orkestrering (MCP/A2A) for å utnytte disse evnene pålitelig. Up North AIs ekspertise sikrer at dine AI-team ikke bare reproduserer overskrifter, men leverer verifiserbare resultater i høyrisikodomener som F&U eller etterlevelse.
Imens øker US AI-kompetanserammeverket presset for oppkvalifisering av arbeidsstyrken, spesielt siden EU-regler henger etter i fleksibilitet. Våre tjenester for AI-kvalitet og tillit, samt utfallsteknikk, hjelper til med å bygge bro over dette gapet ved å auditerer modeller for robusthet og tilpasse dem til forretningsdom. Kode er gratis. Dom er det ikke.
Nøkkeltakeaway: Grense-AI produserer nå publiserbar vitenskap; invester i orkestrering og tillitslag nå for å omdanne rå kapasitet til konkurransefortrinn – eller risiker å måtte ta igjen.
Kilder
- https://x.com/sama
- https://x.com/OpenAI
- https://x.com/SebastienBubeck
- https://openai.com/index/new-result-theoretical-physics
- https://x.com/OpenAI/status/2022390096625078389
- https://x.com/BoWang87/status/2022406976911863931
- https://www.dol.gov/newsroom/releases/eta/eta20260213
- https://www.benton.org/headlines/ai-literacy-framework
- https://stefanbauschard.substack.com/p/the-federal-government-just-told
Hold deg oppdatert om AI
Ingen spam. Meld deg av når som helst.
Trenger du hjelp med å forstå AI?
Å lese nyheter er én ting. Å vite hva du skal gjøre med det er en annen. Vi hjelper bedrifter med å omsette AI-trender til handling.