Daglig sammanfattning: OpenAI lanserar EVMbench-benchmark för AI-agenter på sårbarheter i smarta kontrakt
OpenAI lanserar EVMbench-benchmark för AI-agenter på sårbarheter i smarta kontrakt. World Labs samlar in 1 miljard dollar ledd av NVIDIA, AMD för Spatial Intelligence AI-modeller. Saudiarabiska HUMAIN investerar 3 miljarder dollar i xAI-serie.
OpenAI lanserar EVMbench-benchmark för AI-agenter på sårbarheter i smarta kontrakt
OpenAI släppte EVMbench idag, en ny benchmark för att testa AI-agenter på att upptäcka, utnyttja och fixa sårbarheter i Ethereum-sma rta kontrakt. Kuraterad från 40 revisionsrepos med 120 hög allvarlighetsgradsproblem, använder den programmatisk bedömning för objektivitet. Utvecklad med Paradigm, exponerade den brister: toppmodeller som GPT-5.3-Codex nådde 72,2 % på utnyttjande men misslyckades med detektering och patchning.[1][2][3]
OpenAI satsar 10 miljoner dollar på cybersäkerhetsforskning, vilket signalerar seriöst engagemang för agentisk AI i blockchain. OpenAIs annonseringspost fick över 6k likes, med krypto- och AI-folk som prisade den verklighetsbaserade testriggen.
Detta kan minska de miljarder som förloras årligen till utnyttjande, och driva agenter mot pålitliga säkerhetsroller.
World Labs samlar in 1 miljard dollar ledd av NVIDIA, AMD för Spatial Intelligence AI-modeller
Fei-Fei Lis World Labs stängde precis en massiv runda på 1 miljard dollar den 18 februari, ledd av NVIDIA och AMD, med Fidelity och Autodesk som chippade in 200 miljoner dollar. Bygger på deras 2024 seed på 230 miljoner dollar, siktar de på frontier-modeller för 3D spatial intelligens – tänk perception, interaktion och integration i desigverktyg.[4][5][6]
Det är en VC-pivot från LLMs till embodied AI, med stora satsningar på "world models" för verklighetsappar som arkitektur. Posten fick 856 likes, med VCs som @zeinatab som lyfte fram chipjättarnas stöd.
Saudiarabiska HUMAIN investerar 3 miljarder dollar i xAI Series E inför SpaceX-förvärv
Saudiarabiska PIF-stödda HUMAIN hällde in 3 miljarder dollar i xAIs 20 miljarder dollar Series E i början av februari, precis innan SpaceX-förvärvet. Andelarna konverteras till SpaceX-aktier, vilket positionerar HUMAIN som en stor spelare i den kombinerade enheten på 1,25 biljoner dollar, och förlänger deras datacenterband.[7][8]
Detta understryker Mellanösterns AI-guldfeber och Musks ekosystemdragkraft. HUMAINs Tareq Amin delade stoltheten på X, vilket skapade buzz kring strategiska allianser.
Scout AI presenterar Fury autonomt fordonorkestrerare för militära tillämpningar
Scout AI lanserade Fury idag efter ett års utveckling: det första agentiska systemet som omvandlar naturliga språkmissions till koordinerade åtgärder för drönar- och markfordonsflottor. U.S. Army-demo visade autonoma anfall med stridsskadebedömning; de har säkrat kontrakt för ISV:er.[10][11][12]
Video från @adcock_colby fick 651 likes, vilket eldade på snack om AI-agenter i kinetiska operationer. Detta hoppar försvarsrobotiken framåt.
India AI Impact Summit 2026 lockar nordiska ledare från Sverige och Finland
På New Delhis AI Impact Summit (16-20 feb), träffade Sveriges biträdande PM Ebba Busch och Finlands PM Petteri Orpo Modi för att driva AI-samarbete, suverän tech, etik och India-EU FTA. Busch prisade Modis vision för hållbart nordiskt-indiskt samarbete.[13][14][15]
Diplomatisk X-buzz inkluderade MEAIndia som välkomnade Orpo – prima för nordiska företag som siktar på globala partnerskap.
Vad det här betyder för ditt företag
Agent-benchmarks som EVMbench belyser gapet mellan hype och tillförlitlighet i multi-agent-system – perfekt för Up North AIs kvalitets- & förtroenderecensioner och outcome engineering. När modeller kämpar med patchning behöver företag omdöme för att orkestrera säkra arbetsflöden, oavsett i blockchain eller bortom. Vår MCP/A2A-expertis förvandlar rå agentkraft till pålitliga team, som ekar "Code is free. Judgment isn't."
Finansieringsruscher (World Labs, xAI) och försvarsspel som Fury skriker efter multi-agent-orkestrering. Spatial AI och fysiska flottor kräver agentarbetskraftdesign som skalar från sims till verkliga operationer. Nordiska ledare på India Summit öppnar dörrar för EU-Asien-piloter i etisk AI.
Viktig insikt: Investera i validerade agent-system nu – benchmarks visar att råa modeller inte räcker ensamma. Up North AI engineerar outcomes som levererar.
Källor
- https://cdn.openai.com/evmbench/evmbench.pdf
- https://cryptobriefing.com/ai-security-benchmarking-system
- https://www.coindesk.com/tech/2026/02/18/sam-altman-s-openai-unveils-evmbench-to-test-whether-ai-can-keep-crypto-s-smart-contracts-safe
- https://finance.yahoo.com/news/ai-pioneer-fei-fei-lis-202957884.html
- https://techcrunch.com/2026/02/18/world-labs-lands-200m-from-autodesk-to-bring-world-models-into-3d-workflows
- https://www.thedeepview.com/articles/world-labs-raises-usd1b-as-vcs-look-beyond-llms
- https://finance.yahoo.com/news/saudi-arabia-humain-invests-3-123558006.html
- https://www.semafor.com/article/02/18/2026/saudis-humain-invests-3b-in-elon-musks-xai
- https://www.prnewswire.com/news-releases/scout-ai-introduces-fury-autonomous-vehicle-orchestrator-302691787.html
- https://scoutco.ai/
- https://www.wired.com/story/ai-lab-scout-ai-is-using-ai-agents-to-blow-things-up
- https://www.newindiaabroad.com/english/news/swedish-finnish-uk-leaders-arrive-in-delhi-for-ai-impact-summit
- https://m.economictimes.com/news/newsblogs/ai-impact-summit-2026-delhi-live-updates-day-2-announcements-narendra-modi-bharat-mandapam-french-president-macron-visit-india/liveblog/128449060.cms
- https://www.livemint.com/technology/ai-summit-delhi-2026-live-updates-ai-impact-summit-day-3-bharat-mandapam-india-narendra-modi-delhi-expo-18-february-2026-11771376974825.html
Håll dig uppdaterad om AI
Ingen spam. Avsluta prenumerationen när som helst.
Behöver du hjälp att förstå AI?
Att läsa nyheter är en sak. Att veta vad man ska göra åt det är en annan. Vi hjälper företag att omvandla AI-trender till handling.