Up North AIUp North
Til baka í fréttir

Daglegt yfirlit: OpenAI kynnir EVMbench mælikvarða fyrir AI-umboðsmenn á veikleika í snjallsamningum

OpenAI kynnir EVMbench mælikvarða fyrir AI-umboðsmenn á veikleika í snjallsamningum. World Labs safnar $1B undir forystu NVIDIA og AMD fyrir rýmisgreindar AI-líkan. Sádi HUMAIN fjárfestir $3B í xAI-röð.

Share

OpenAI kynnir EVMbench mælikvarða fyrir AI-umboðsmenn á veikleika í snjallsamningum

OpenAI lymskti EVMbench í dag, nýjan mælikvarða til að prófa AI-umboðsmenn í að greina, nýta og laga veikleika í Ethereum-snjallsamningum. Samansettur úr 40 endurskoðunarvinnusvæðum með 120 alvarlegum vandamálum, notar hann sjálfvirka einkunnagjöf til hlutleysis. Þróað með Paradigm, það afhjúpaði bil: efstu líkön eins og GPT-5.3-Codex náðu 72,2% á nýtingu en brugðust við greiningu og lagfæringum.[1][2][3]

OpenAI leggur $10M í rannsóknir á netsöguvarna, sem gefur til kynna alvarlega skuldbindingu við agentíska AI í blockchain. Fyrirmæli OpenAI fengu yfir 6k like, með crypto- og AI-fólki að hrósa krefjandi prófunum í raunveruleikanum.

Þetta gæti skorið niður milljarðana sem glatast vegna nýtinga árlega og ýtt umboðsmönnum áleiðis í áreiðanlegar öryggishlutverki.

World Labs safnar $1B undir forystu NVIDIA og AMD fyrir rýmisgreindar AI-líkan

World Labs Fei-Fei Li lokaði risavöxlun $1B þann 18. febrúar, undir forystu NVIDIA og AMD, með Fidelity og Autodesk að leggja $200M. Byggt á $230M fræsöfnun 2024, miða þeir að fremstu líkönum fyrir 3D rýmisgreind — hugsaðu um skynjun, samskipti og innleiðingu í hönnunarverkfæri.[4][5][6]

Þetta er VC-skipti frá LLM til líkamlegrar AI, veðja stórt á „world models“ fyrir raunverulegar forrit eins og arkitektúr. Fyrirmælið fékk 856 like, með VC eins og @zeinatab að vekja athygli á stuðningi frá flísrisunum.

Sádi HUMAIN fjárfestir $3B í xAI-röð E fyrir framan SpaceX yfirtöku

Sádi PIF-studdur HUMAIN hellti $3B í $20B röð E xAI í byrjun febrúar, beint fyrir yfirtöku SpaceX. Hlutabréf breytast í SpaceX hlutabréf, sem setur HUMAIN sem stóran leikmann í sameinuðu $1,25T einingu, framlengir tengsl við gagnaver.[7][8]

Þetta undirstrikar gullæði Mið-Austurlanda í AI og dróttna Musk yfir vistkerfið. Tareq Amin hjá HUMAIN deildi stolti sínum á X, sem kveikti umræður um stefnumótandi bandalög.

Scout AI afhjúpar Fury sjálfstýringu farartækja stjórnanda fyrir hernotkun

Scout AI lymskti Fury í dag eftir ár af þróun: fyrsta agentíska kerfið sem breytir náttúrulegu máli missjónum í samræmdar aðgerðir fyrir dróna- og jörðfarartækjaflota. Sýning bandaríska herinnar sýndi sjálfstæðir högg með mati á orðuskemmdum; þeir hafa fest samninga við ISV.[10][11][12]

Myndband frá @adcock_colby fékk 651 like, sem ýtti undir umræður um AI-umboðsmenn í hreyfiaðgerðum. Þetta stökkvar vörnum vélmenni fram á við.

India AI Impact Summit 2026 laðar leiðtoga frá Norðurlöndum úr Svíþjóð og Finnlandi

Á AI Impact Summit í New Delhi (16.-20. febrúar), Svíþjóðar varadrottning Ebba Busch og Finnlands forsætisráðherra Petteri Orpo hittu Modi til að ýta á AI-tengsl, sjálfráðri tækni, siðfræði og India-EU FTA. Busch lofaði sjónarmið Modi um sjálfbæra samstarf Norðurlanda og Indlands.[13][14][15]

Diplómatískir X-umræður innihéldu MEAIndia að taka á móti Orpo — frábært fyrir Norðurlandsfyrirtæki sem sækja eftir alþjóðlegum samstarfi.

Hvað þetta þýðir fyrir fyrirtækið þitt

Mælikvarðar á umboðsmenn eins og EVMbench sýna bilið milli hype og áreiðanleika í margumboðsmannakerfum — fullkomið fyrir gæðaprófanir og traust Up North AI og útkomutækni. Þar sem líkön eiga erfitt með lagfæringar þurfa fyrirtæki dómgreind til að stjórna öruggum ferlum, hvort sem er í blockchain eða á öðrum sviðum. MCP/A2A sérfræði okkar breytir hráum krafti umboðsmanna í áreiðanlegar liðsheild, sem endhefur „Code er ókeypis. Dómur er ekki“.

Fjárfestingar aukast (World Labs, xAI) og varnarmál eins og Fury kalla á eftirspurn eftir stjórnun margumboðsmanna. Rýmis-AI og líkamlegir flotar krefjast hönnunar á umboðsmannavinnuafl sem skala frá hermum til raunverulegra aðgerða. Norðurlandsleiðtogar á India Summit opna dyr fyrir EU-Asía tilraunum í siðferðislegri AI.

Lykilniðurstaða: Fjárfestu í prófuðum umboðsmannakerfum nú — mælikvarðar sanna að hrá líkön nægja ekki ein.“


## Heimildir
1. https://cdn.openai.com/evmbench/evmbench.pdf  
2. https://cryptobriefing.com/ai-security-benchmarking

Vertu upplýst um AI

Enginn ruslpóstur. Hætta við áskrift hvenær sem er.

Þarftu hjálp við að skilja gervigreind?

Að lesa fréttir er eitt. Að vita hvað á að gera við þær er annað. Við hjálpum fyrirtækjum að breyta gervigreindarþróun í aðgerðir.