Up North AIUp North
Takaisin uutisiin

Päivittäinen katsaus: OpenAI julkaisee EVMbench-benchmarkin AI-agenttien käyttöön älysopimusten haavoittuvuuksissa

OpenAI julkaisee EVMbench-benchmarkin AI-agenttien käyttöön älysopimusten haavoittuvuuksissa. World Labs kerää 1 miljardin dollarin rahoituksen NVIDIA:n ja AMD:n johtamana avaruudellisen älykkyyden AI-malleille. Saudi HUMAIN sijoittaa 3 miljardia xAI:n sarjaan.

Share

OpenAI julkaisee EVMbench-benchmarkin AI-agenttien käyttöön älysopimusten haavoittuvuuksissa

OpenAI julkaisi tänään EVMbenchin, uuden benchmarkin AI-agenttien testaamiseen älysopimusten haavoittuvuuksien havaitsemisessa, hyödyntämisessä ja korjaamisessa Ethereumissa. Koottu 40 auditointirepositoriosta, joissa on 120 vakavaa ongelmaa, se käyttää ohjelmallista arviointia objektiivisuuden takaamiseksi. Kehitetty Paradigm-yhteistyössä, se paljasti puutteita: huippumallit kuten GPT-5.3-Codex saavuttivat 72,2 % hyödyntämisissä mutta epäonnistuivat havaitsemisessa ja korjaamisessa.[1][2][3]

OpenAI investoi 10 miljoonaa dollaria kyberturvallisuustutkimukseen, mikä signaloi vakavan sitoutumisen agenttipohjaiseen AI:hin lohkoketjussa. OpenAI:n julkaisuposti keräsi yli 6k tykkäystä, kun kryptomaailman ja AI-asiantuntijat ylistivät reaaliaikaista testauslujuutta.

Tämä voi leikata miljardeja dollareita vuodessa eksploiteista menetettyjä varoja ja työntää agentteja kohti luotettavia turvallisuusrooleja.

World Labs kerää 1 miljardin dollarin rahoituksen NVIDIA:n ja AMD:n johtamana avaruudellisen älykkyyden AI-malleille

Fei-Fei Lin World Labs sulki massiivisen 1 miljardin dollarin kierroksen 18. helmikuuta, NVIDIA:n ja AMD:n johtamana, Fidelityn ja Autodeskin osallistuessa 200 miljoonalla dollarilla. Rakennettu vuoden 2024 230 miljoonan dollarin siemenrahoituksen pohjalta, he tähtäävät rajamalleihin 3D-avaruudelliseen älykkyyteen – ajattele havainnointia, vuorovaikutusta ja integrointia suunnittelutyökaluihin.[4][5][6]

Kyseessä on VC-siirtymä LLM:istä ruumiillistettuun AI:hin, iso panos ”maailmamalleihin” reaaliaikaisiin sovelluksiin kuten arkkitehtuuriin. Posti keräsi 856 tykkäystä, VC:t kuten @zeinatab korostivat sirujättien tukea.

Saudi HUMAIN sijoittaa 3 miljardia xAI:n sarjaan E edeltävänä SpaceX-kauppana

Saudi PIF:n tukema HUMAIN kaatoi 3 miljardia dollaria xAI:n 20 miljardin dollarin sarjaan E helmikuun alussa, aivan SpaceX:n oston alla. Panokset muunnetaan SpaceX-osakkeiksi, asemoiden HUMAINin merkittäväksi pelaajaksi 1,25 biljoonan dollarin yhdistetyssä kokonaisuudessa, laajentaen heidän datakeskusyhteyksiään.[7][8]

Tämä korostaa Lähi-idän AI-kultakuumeen ja Muskin ekosysteemin vetovoimaa. HUMAINin Tareq Amin jakoi ylpeytensä X:ssä, herättäen kohua strategisista liitoista.

Scout AI esittelee Fury-autonomisen ajoneuvo-orchestratorin sotilassovelluksiin

Scout AI käynnisti tänään Furyn vuoden kehityksen jälkeen: ensimmäisen agenttijärjestelmän, joka muuttaa luonnollisen kielen tehtävät koordinoituiksi toimiksi droonien ja maajoneuvojen laivastoille. Yhdysvaltain armeijan demo näytti autonomisia iskuja taisteluvahinkojen arvioinnilla; he ovat lukinneet sopimuksia ISV:ille.[10][11][12]

@adcock_colbyn video keräsi 651 tykkäystä, ruokien keskustelua AI-agenteista kinettisissa operaatioissa. Tämä sysää puolustusrobotiikkaa eteenpäin.

India AI Impact Summit 2026 houkuttelee pohjoismaisia johtajia Ruotsista ja Suomesta

New Delhin AI Impact Summitissa (16.–20.2.) Ruotsin varapääministeri Ebba Busch ja Suomen pääministeri Petteri Orpo tapasivat Modin edistääkseen AI-yhteyksiä, suvereenia teknologiaa, etiikkaa ja India-EU FTA:ta. Busch ylisti Modin näkemystä kestävästä pohjoismais-intialaisesta yhteistyöstä.[13][14][15]

Diplomaattinen X-kohu sisälsi MEAIndian tervetuliaiset Orpolle – otollinen pohjoismaisille firmoille, jotka tähtäävät globaaleihin kumppanuuksiin.

Mitä tämä tarkoittaa yrityksellesi

Agenttibenchmarkit kuten EVMbench korostavat kuilua hypeen ja luotettavuuteen moniagenttijärjestelmissä – täydellistä Up North AI:n laadun & luottamuksen tarkastuksille ja lopputulosinsinööritoiminnalle. Kun mallit kamppailevat korjaamisissa, yritykset tarvitsevat harkintaa turvallisten työnkulkujen orchestrointiin, olipa kyse lohkoketjusta tai sen ulkopuolelta. MCP/A2A-asiantuntemuksemme muuttaa raakaa agenttivoimaa luotettaviksi tiimeiksi, kaikuen ”Koodi on ilmaista. Harkinta ei ole.”

Rahoituksen nousut (World Labs, xAI) ja puolustuspelaat kuten Fury huutavat moniagentti-orchestrationin kysyntää. Avaruudellinen AI ja fyysiset laivastot vaativat agenttityövoiman suunnittelua, joka skaalautuu simulaatioista reaalioperaatioihin. Pohjoismaiset johtajat Intian huippukokouksessa avaavat ovia EU-Aasia-piloteille eettisessä AI:ssa.

Pää takeaway: Sijoita validoituihin agenttijärjestelmiin nyt – benchmarkit todistavat, että raakamallit eivät riitä yksin. Up North AI insinööröi lopputuloksia, jotka toimittavat.

Lähteet

  1. https://cdn.openai.com/evmbench/evmbench.pdf
  2. https://cryptobriefing.com/ai-security-benchmarking-system
  3. https://www.coindesk.com/tech/2026/02/18/sam-altman-s-openai-unveils-evmbench-to-test-whether-ai-can-keep-crypto-s-smart-contracts-safe
  4. https://finance.yahoo.com/news/ai-pioneer-fei-fei-lis-202957884.html
  5. https://techcrunch.com/2026/02/18/world-labs-lands-200m-from-autodesk-to-bring-world-models-into-3d-workflows
  6. https://www.thedeepview.com/articles/world-labs-raises-usd1b-as-vcs-look-beyond-llms
  7. https://finance.yahoo.com/news/saudi-arabia-humain-invests-3-123558006.html
  8. https://www.semafor.com/article/02/18/2026/saudis-humain-invests-3b-in-elon-musks-xai
  9. https://www.prnewswire.com/news-releases/scout-ai-introduces-fury-autonomous-vehicle-orchestrator-302691787.html
  10. https://scoutco.ai/
  11. https://www.wired.com/story/ai-lab-scout-ai-is-using-ai-agents-to-blow-things-up
  12. https://www.newindiaabroad.com/english/news/swedish-finnish-uk-leaders-arrive-in-delhi-for-ai-impact-summit
  13. https://m.economictimes.com/news/newsblogs/ai-impact-summit-2026-delhi-live-updates-day-2-announcements-narendra-modi-bharat-mandapam-french-president-macron-visit-india/liveblog/128449060.cms
  14. https://www.livemint.com/technology/ai-summit-delhi-2026-live-updates-ai-impact-summit-day-3-bharat-mandapam-india-narendra-modi-delhi-expo-18-february-2026-11771376974825.html

Pysy ajan tasalla AI:sta

Ei roskapostia. Peruuta tilaus milloin tahansa.

Tarvitsetko apua tekoälyn ymmärtämiseen?

Uutisten lukeminen on yksi asia. Tietäminen mitä niille tehdä on toinen. Autamme yrityksiä muuttamaan tekoälytrendit toiminnaksi.