Up North
Tillbaka till nyheter

Daglig sammanfattning: OpenAIs interna modeller lyckas med sex av tio 'First Proof' forskningsnivå matematikproblem

OpenAIs interna modeller lyckas med sex av tio 'First Proof' forskningsnivå matematikproblem. OpenAIs GPT-5.2 härleder nytt gluoninteraktionsresultat i teoretisk fysikpreprint. USA:s arbetsdepartement.

orchestrationregulationMCPA2A

OpenAIs interna modeller lyckas med sex av tio 'First Proof' forskningsnivå matematikproblem

OpenAIs interna modeller tog sig an tio opublicerade forskningsnivå matematikproblem kända som "First Proof"-utmaningarna, utformade för att testa AI:s förmåga att generera nya bevis. I en veckolång sprint med minimal mänsklig översyn levererade modellerna lovande lösningar på minst sex, som experter bedömer som troligen korrekta. Detta markerar ett språng från grundläggande matematikförmågor till framskjutande forskning, som Sam Altman framhöll.[1][2][3]

Altman kallade det en nyckelvärdering för nästa generations AI, medan OpenAIs chefsforskare noterade framgångsgraden 6/10. Sebastien Bubeck delade utmaningen offentligt för att benchmarka system, och reaktionerna på X exploderade – Greg Brockman ekade entusiasmen, med vissa användare som hyllade det som en "AGI uppnådd internt"-stund.[1][2][3]

OpenAIs GPT-5.2 härleder nytt gluoninteraktionsresultat i teoretisk fysikpreprint

Den 14 februari medförfattade GPT-5.2 en preprint med forskare från IAS, Vanderbilt, Cambridge och Harvard, som föreslår en sluten formel för "single-minus" gluon tree amplitudes – interaktioner som länge antagits vara noll i läroböcker. En intern OpenAI-modell bevisade det, med människor som verifierade upp till n=6 fall. Resultatet avslöjar icke-noll amplituder under specifika förhållanden som all-plus helicity för andra gluoner, vilket potentiellt förenklar kvantfältteoriberäkningar.[4][5][6]

OpenAI delade nyheten på X och betonade hur GPT-5.2 utmanade antaganden: en gluoninteraktion "som många fysiker förväntade sig inte skulle inträffa kan uppstå under specifika förhållanden." Kevin Weil noterade att årtionden av antaganden vänds, och Bo Wang (@BoWang87) skämtade att GPT-5.2 i princip sa: "Tänk om de kan – under dessa förhållanden?"[5][6]

USA:s arbetsdepartement släpper första nationella ramverket för AI-kunskap

USA:s arbetsdepartement släppte nationens första ramverk för AI-kunskap den 13 februari, som beskriver kärninnehållsområden och leveransprinciper för AI-utbildning. Det knyter an till Vita husets America's AI Action Plan från juli 2025, som driver finansiering för Workforce Innovation mot AI-kunskapsprogram och siktar på att leda global AI-utplacering skild från EU-regleringar.[7][8][9]

Medan reaktionerna på X var dämpade bland stora namn belyser diskussionerna dess ringar på vattnet på K-12 och bortom, och positionerar USA för att forma normer för AI-kunskap mot EU AI Acts strängare tillvägagångssätt.[7][8][9]

Vad detta betyder för ditt företag

OpenAIs genombrott i matematikbevis och fysikhärledningar signalerar att AI korsar in i genuin vetenskaplig upptäckt – bortom mönster-matchning till generering av nya hypoteser. För nordiska företag understryker detta behovet av design av agentarbetskraft och multi-agent-orkestrering (MCP/A2A) för att utnyttja dessa förmågor pålitligt. Up North AIs expertis säkerställer att dina AI-team inte bara replikerar rubriker utan levererar verifierbara resultat i högriskdomäner som FoU eller efterlevnad.

Under tiden ökar ramverket för AI-kunskap i USA trycket för uppgradering av arbetskraften, särskilt då EU-regleringar halkar efter i flexibilitet. Våra tjänster för AI-kvalitet & förtroende samt outcome engineering hjälper till att överbrygga detta gap, genom att granska modeller för robusthet och aligna dem med affärsbedömning. Kod är gratis. Bedömning är det inte.

Nyckeltips: Frontier AI producerar nu publicerbar vetenskap; investera i orkestrering och förtroendelager nu för att omvandla rå kapacitet till konkurrensfördel – eller riskera att hamna efter.

Källor

  1. https://x.com/sama
  2. https://x.com/OpenAI
  3. https://x.com/SebastienBubeck
  4. https://openai.com/index/new-result-theoretical-physics
  5. https://x.com/OpenAI/status/2022390096625078389
  6. https://x.com/BoWang87/status/2022406976911863931
  7. https://www.dol.gov/newsroom/releases/eta/eta20260213
  8. https://www.benton.org/headlines/ai-literacy-framework
  9. https://stefanbauschard.substack.com/p/the-federal-government-just-told

Håll dig uppdaterad om AI

Ingen spam. Avsluta prenumerationen när som helst.

Behöver du hjälp att förstå AI?

Att läsa nyheter är en sak. Att veta vad man ska göra åt det är en annan. Vi hjälper företag att omvandla AI-trender till handling.