Up North
Tilbage til nyheder

Daglig Briefing: OpenAI Lancerer EVMbench Benchmark for AI-Agenter på Sårbarheder i Smart Contracts

OpenAI lancerer EVMbench Benchmark for AI-Agenter på Sårbarheder i Smart Contracts. World Labs rejser 1 mia. USD ledet af NVIDIA, AMD til Spatial Intelligence AI-modeller. Saudi HUMAIN investerer 3 mia. USD i xAI-serien.

orchestrationLLMagentsMCPA2A

OpenAI Lancerer EVMbench Benchmark for AI-Agenter på Sårbarheder i Smart Contracts

OpenAI lancerede i dag EVMbench, en ny benchmark til at teste AI-agenter på at opdage, udnytte og rette sårbarheder i Ethereum smart contracts. Samlet fra 40 audit-repos med 120 høj-severity-problemer, den bruger programmatisk vurdering for objektivitet. Udviklet i samarbejde med Paradigm, den afslørede mangler: topmodeller som GPT-5.3-Codex nåede 72,2 % på exploits, men svigtede på detektion og patching.[1][2][3]

OpenAI investerer 10 mio. USD i cybersecurity-forskning, hvilket signalerer alvorlig forpligtelse til agentic AI i blockchain. OpenAI's annonceringspost samlede over 6k likes, med crypto- og AI-folk der roste den real-world test-rigor.

Dette kunne skære de milliarder, der årligt tabes til exploits, og skubbe agenter mod pålidelige sikkerhedsroller.

World Labs Rejser 1 mia. USD Ledet af NVIDIA, AMD til Spatial Intelligence AI-modeller

Fei-Fei Li's World Labs har lige lukket en massiv runde på 1 mia. USD den 18. februar, ledet af NVIDIA og AMD, med Fidelity og Autodesk der bidrog med 200 mio. USD. Bygger på deres 2024 seed-runde på 230 mio. USD, sigter de mod frontier-modeller for 3D spatial intelligence – tænk perception, interaktion og integration i designværktøjer.[4][5][6]

Det er en VC-pivot fra LLMs til embodied AI, med store satsninger på "world models" til real-world-apps som arkitektur. Posten fik 856 likes, med VCs som @zeinatab der fremhævede chip-giganternes støtte.

Saudi HUMAIN Investerer 3 mia. USD i xAI Series E forud for SpaceX-overtagelse

Saudi PIF-backede HUMAIN pumpede 3 mia. USD ind i xAI's 20 mia. USD Series E i begyndelsen af februar, lige før SpaceX's overtagelse. Andele konverteres til SpaceX-aktier, hvilket positionerer HUMAIN som en stor spiller i den kombinerede enhed på 1,25 billioner USD og udvider deres datacenter-sammenhænge.[7][8]

Dette understreger Mellemøstens AI-guldrus og Musks økosystem-træk. HUMAIN's Tareq Amin delte stoltheden på X, hvilket skabte buzz om strategiske alliancer.

Scout AI Afslører Fury Autonomous Vehicle Orchestrator til Militære Anvendelser

Scout AI lancerede i dag Fury efter et års udvikling: det første agentic system, der omdanner naturlige sprog-missioner til koordinerede handlinger for drone- og jordkøretøjsflåder. U.S. Army-demo viste autonome angreb med battle damage assessment; de har låst kontrakter med ISVs.[10][11][12]

Video fra @adcock_colby fik 651 likes og nærede snak om AI-agenter i kinetiske operationer. Dette springer forsvarsrobotik fremad.

India AI Impact Summit 2026 Tiltrækker Nordiske Ledere fra Sverige og Finland

Ved New Delhis AI Impact Summit (16.-20. feb.) mødtes Sveriges vice-PM Ebba Busch og Finlands PM Petteri Orpo Modi for at fremme AI-samarbejde, sovereign tech, etik og India-EU FTA. Busch roste Modis vision for bæredygtigt nordisk-indisk samarbejde.[13][14][15]

Diplomatisk X-buzz inkluderede MEAIndia, der ønskede Orpo velkommen – prime for nordiske firmaer, der øjer globale partnerskaber.

Hvad Dette Betyder for Din Virksomhed

Agent-benchmarks som EVMbench fremhæver kløften mellem hype og pålidelighed i multi-agent-systemer – perfekt til Up North AI's kvalitet- og tillidsgennemgange samt outcome engineering. Da modellerne kæmper med patching, har virksomheder brug for dømmekraft til at orkestrere sikre workflows, uanset om det er i blockchain eller derudover. Vores MCP/A2A-ekspertise forvandler rå agent-kraft til pålidelige teams, der ekkoer "Code is free. Judgment isn't."

Finansieringssurgens (World Labs, xAI) og forsvarsspil som Fury skriger efter efterspørgsel på multi-agent orchestration. Spatial AI og fysiske flåder kræver agent-arbejdsstyrke-design, der skalerer fra sims til real ops. Nordiske ledere ved India Summit åbner døre for EU-Asien-piloter i etisk AI.

Nøglebudskab: Invester i verificerede agent-systemer nu – benchmarks beviser, at rå modeller ikke rækker alene. Up North AI designer outcomes, der leverer.

Kilder

  1. https://cdn.openai.com/evmbench/evmbench.pdf
  2. https://cryptobriefing.com/ai-security-benchmarking-system
  3. https://www.coindesk.com/tech/2026/02/18/sam-altman-s-openai-unveils-evmbench-to-test-whether-ai-can-keep-crypto-s-smart-contracts-safe
  4. https://finance.yahoo.com/news/ai-pioneer-fei-fei-lis-202957884.html
  5. https://techcrunch.com/2026/02/18/world-labs-lands-200m-from-autodesk-to-bring-world-models-into-3d-workflows
  6. https://www.thedeepview.com/articles/world-labs-raises-usd1b-as-vcs-look-beyond-llms
  7. https://finance.yahoo.com/news/saudi-arabia-humain-invests-3-123558006.html
  8. https://www.semafor.com/article/02/18/2026/saudis-humain-invests-3b-in-elon-musks-xai
  9. https://www.prnewswire.com/news-releases/scout-ai-introduces-fury-autonomous-vehicle-orchestrator-302691787.html
  10. https://scoutco.ai/
  11. https://www.wired.com/story/ai-lab-scout-ai-is-using-ai-agents-to-blow-things-up
  12. https://www.newindiaabroad.com/english/news/swedish-finnish-uk-leaders-arrive-in-delhi-for-ai-impact-summit
  13. https://m.economictimes.com/news/newsblogs/ai-impact-summit-2026-delhi-live-updates-day-2-announcements-narendra-modi-bharat-mandapam-french-president-macron-visit-india/liveblog/128449060.cms
  14. https://www.livemint.com/technology/ai-summit-delhi-2026-live-updates-ai-impact-summit-day-3-bharat-mandapam-india-narendra-modi-delhi-expo-18-february-2026-11771376974825.html

Hold dig opdateret om AI

Ingen spam. Afmeld dig når som helst.

Har du brug for hjælp til at forstå AI?

At læse nyheder er én ting. At vide hvad man skal gøre ved det er en anden. Vi hjælper virksomheder med at omsætte AI-tendenser til handling.