25 000 tehtävän todellisuustarkistus
25 000 tehtävän todellisuustarkistus. Endogeenisuusparadoksi: Miksi rakenne tappaa suorituskyvyn. Missä suositut kehykset menevät pieleen.
25 000 tehtävän todellisuustarkistus
Tutkijat eturintamassa juuri romuttivat perinteisen viisauden moniagenttijärjestelmistä. Dochkina et al. testasivat 8 eri LLM:ää 25 000 tehtävässä, skaalaten 4:stä 256 agenttiin kaikissa kuviteltavissa olevissa koordinaatioprotokolloissa—jäykistä CrewAI-tyylisistä hierarkioista täydelliseen anarkiaan [1].
Tulokset paljastavat sen, mitä rakentajat epäilivät: ennalta määrätyt roolit ja jäykät kehykset suoriutuvat johdonmukaisesti heikommin. Itsejärjestäytyvät tiimit minimaalisella tukirakennelmalla voittavat strukturoidut lähestymistavat jopa 14 % monimutkaisissa päättelytehtävissä.
Tutkimus testasi kaikkea GPT-4o:sta Claude 3.5:een ja Llama-3.1:een, mittaen suorituskykyä rinnakkaistettavissa tehtävissä (tutkimussynteesissä, data-analyysissä) ja peräkkäisissä työnkuluissa (koodin generoinnissa, dokumenttien luomisessa). Malli piti mallien ja mittakaavojen yli.
Mutta tässä on ydin: ei maksimaalinen kontrolli eikä maksimaalinen kaaos voita. Kultainen keskitie löytyy siitä, mitä tutkijat kutsuvat "minimaaliseksi tukirakennelmaksi"—juuri tarpeeksi rakennetta, jotta kyvykkäät LLM:t voivat itsejärjestäytyä, ilman ennalta määrättyjen hierarkioiden ylimääräistä kuormaa.
Endogeenisuusparadoksi: Miksi rakenne tappaa suorituskyvyn
Ydinhavainto haastaa kaiken, mitä luulimme tietävämme AI-koordinaatiosta. Tutkijat löysivät "endogeenisuusparadoksin": ei maksimaalinen ulkoinen kontrolli eikä maksimaalinen agenttiautonomia tuota optimaalisia tuloksia [1].
Ajattele sitä kuin pohjoismaista työkulttuuria. Tuottavimmat tiimit eivät ole mikrohallittuja hierarkioita tai täydellisiä vapaan pelin tilanteita. Ne ovat ryhmiä kyvykkäitä ihmisiä selkeillä tavoitteilla ja minimaalisella byrokratialla. LLM:t, kuten käy ilmi, noudattavat samankaltaisia malleja.
Jäykät kehykset epäonnistuvat, koska ne estävät sopeutumisen. Kun ennalta määrität "analyytikon" roolin agentille, lukitset sen kyseiseen toimintoon, vaikka tehtävä vaatisi erilaista asiantuntemusta. Itsejärjestäytyvät tiimit jakavat rooleja dynaamisesti todellisen kyvykkyyden ja kontekstin perusteella.
Data on karua: itsejärjestäytyvät tiimit saavuttavat 17-22 % korkeammat onnistumisprosentit rinnakkaistettavissa tehtävissä. Mutta ne suoriutuvat heikommin tiukasti peräkkäisessä työssä ilman kevyttä reititystä—vahvistaen, että kontekstin, ei ideologian, tulisi ohjata arkkitehtuuripäätöksiä.
Missä suositut kehykset menevät pieleen
Tutkimus vertaili erityisesti suosittuihin kehyksiin kuten CrewAI ja LangGraph. Tulokset eivät ole kauniita strukturoidulle lähestymistavalle.
"Bag of agents" -arkkitehtuurit nostavat virheprosentit 17-kertaisiksi koordinaatiokuorman vuoksi [6]. Kun jokaisen agentin täytyy tarkistaa jokaisen muun agentin kanssa, kommunikaatiokustannukset räjähtävät nopeammin kuin kyvykkyys skaalautuu. Se on hajautettujen järjestelmien painajainen taas kerran.
Samaan aikaan "enemmän agentteja tarkoittaa parempia tuloksia" -myytti saa perusteellisen kumouksen. Googlen ja DeepMindin skaalaustutkimukset vahvistavat, että ylimääräinen kuorma dominoi yli 8-16 agentin ilman emergenttiä organisaatiota [3]. Useimmat tuotantokuormat osuvat väheneviin tuottoihin paljon aikaisemmin.
Käytännön opetus rakentajille: aloita single-agent sequential (SAS) -mallilla useimmissa tehtävissä. Skaalaa moniagenttimalliin vain, kun sinulla on aitoa rinnakkaisuutta ja koordinaatiohyödyt ylittävät ylimääräiset kustannukset.
Tämä heijastaa sitä, mitä näemme ohjelmistotiimeissä. Kehittäjien lisääminen myöhässä olevaan projektiin tekee siitä myöhäisemmän, mutta oikea tiimin rakenne voi avata aidon rinnakkaistyön. Samat periaatteet pätevät AI-agentteihin.
Rakentajan käsikirja: Milloin ja miten itsejärjestäytyä
Tutkimuksen ja oman tuotantokokemuksemme perusteella, tässä on käytännöllinen kehys:

Aloita yksinkertaisesti: Yhden agentin järjestelmät hoitavat 80 % liiketoimintatehtävistä tehokkaasti. Älä kurkota moniagenttimalliin ennen kuin olet törmännyt selkeisiin yhden agentin rajoihin.
Tunnista aito rinnakkaisuus: Itsejärjestäytyvät tiimit loistavat, kun tehtävät voivat aidosti ajaa rinnakkain—tutkimussynteesissä, data-analyysissä useista lähteistä, sisällöntuotannossa eri yleisöille. Ne kamppailevat luonnostaan peräkkäisen työn kanssa kuten vaiheittaisen debuggauksen.
Käytä minimaalista tukirakennelmaa: Ennalta määrättyjen roolien sijaan anna selkeät tavoitteet ja anna kyvykkäiden LLM:ien itsejärjestäytyä. Ajattele "rakenna markkina-analyysi" mieluummin kuin "agentti A tutkii, agentti B analysoi, agentti C kirjoittaa."
Toteuta kevyt reititys: Sekatyökuormille käytä järjestelmiä kuten BiRouter [5], jotka voivat dynaamisesti päättää yhden agentin ja moniagenttilähestymistapojen välillä tehtävän ominaisuuksien perusteella.
Ohjelmistotekniikan sovellukset ovat erityisen vakuuttavia. Lyu et al. osoittivat itsejärjestäytyviä LLM-tiimejä, jotka heijastavat inhimillisiä kehitysryhmiä, saavuttaen 20 % nopeammat iteraatiosyklit jatkuvassa käyttöönotossa [2]. Nämä järjestelmät kehittävät luonnollisesti erikoistumista—jotkut agentit kallistuvat testaukseen, toiset dokumentaatioon—ilman jäykkiä roolimäärityksiä.
Todellisen maailman todisteet: Koodista organisaatioihin
Vaikutukset ulottuvat ohjelmistojen ulkopuolelle. Itsejärjestäytyvät AI-tiimit nousevat uudeksi organisatoriseksi primitiiviksi, erityisesti tietotyössä.
Pohjoismaiset yritykset ovat varhaisia omaksujia, koska kulttuurinen sopivuus on luonnollista. Tasaiset hierarkiat, autonomiset tiimit ja luottamukseen perustuva koordinaatio sopivat täydellisesti itsejärjestäytyviin AI-järjestelmiin. Kun inhimillinen organisaatiosi jo minimoi byrokratian, tämän periaatteen laajentaminen AI:hin tuntuu ilmeiseltä.
Yksi malli, jota näemme: onnistuneet AI-toteutukset heijastavat onnistuneita inhimillisiä tiimirakenteita. Yritykset jäykillä hierarkioilla kamppailevat itsejärjestäytyvän AI:n kanssa, koska ne yrittävät jatkuvasti pakottaa inhimillisiä organisaatiokaavioita järjestelmiin, jotka toimivat eri tavalla.
Tutkimus vahvistaa tämän intuition. Asiantuntijakommentaari huomauttaa, että "LLM:t kehittävät spontaanisti aivomaisia kerroksia", kun niiden annetaan itsejärjestäytyä [8]. Nämä emergentit rakenteet usein ylittävät suunnitellut hierarkiat, koska ne sopeutuvat todellisiin tietovirtoihin teoreettisten organisaatiokaavioiden sijaan.
Koodin jälkeiset vaikutukset
Tämä tutkimus osoittaa kohti perustavanlaatuista muutosta siinä, miten ajattelemme AI-järjestelmiä. Kun koodista tulee ilmaista, pullonkaula siirtyy harkintaan—ja harkinta sisältää sen tietämisen, milloin pakottaa rakennetta versus milloin antaa emergenssin ottaa vallan.
Perinteinen ohjelmistotekniikka korosti kontrollia ja ennustettavuutta. Suunnittelit järjestelmiä, määrittelit rajapintoja ja hallitsit monimutkaisuutta abstraktiokerrosten kautta. Moniagenttikehykset noudattavat tätä käsikirjaa: määrittele roolit, luo kommunikaatioprotokollat, hallitse tilasiirtymiä.
Mutta LLM:t toimivat enemmän kuin biologiset järjestelmät. Ne kykenevät emergenttiin koordinaatioon, joka usein ylittää suunnitellut rakenteet. Rakentajan työ siirtyy orkestraatiosta kalibrointiin—oikeiden olosuhteiden asettamiseen emergenssiä varten jokaisen vuorovaikutuksen mikrohallinnan sijaan.
Tällä on syvällisiä vaikutuksia siihen, miten rakennamme AI-tuotteita. Monimutkaisten kehysten sijaan tarvitsemme adaptiivisia järjestelmiä, jotka voivat skaalata koordinaatiota dynaamisesti. Ennalta määrättyjen työnkulkujen sijaan tarvitsemme ympäristöjä, joissa AI-agentit voivat löytää optimaalisia yhteistyömalleja.
Pohjoismainen etu tässä on kulttuurinen. Luottamukseen ja minimaaliseen hierarkiaan rakennetut yhteiskunnat ovat luonnollisesti parempia suunnittelemaan AI-järjestelmiä, jotka hyödyntävät emergenssiä sen sijaan, että taistelisivat sitä vastaan.
AI-organisaatioiden tulevaisuus
Tulevaisuuteen katsoen itsejärjestäytyvät AI-tiimit edustavat enemmän kuin teknistä optimointia. Ne ovat esikatsaus siitä, miten AI-natiivit organisaatiot saattavat toimia.
Endogeeniset organisaatiot—joissa rakenne syntyy kyvykkyydestä pakotetun hierarkian sijaan—voisivat tulla oletukseksi AI-vahvistetussa työssä. Inhimilliset johtajat keskittyisivät tavoitteiden asettamiseen ja kulttuurin ylläpitämiseen, kun AI-tiimit itsejärjestäytyisivät tiettyjen tuotosten ympärille.
Tutkimus viittaa siihen, että näemme jo tätä siirtymää. Tehokkaimmat AI-toteutukset eivät kopioi inhimillisiä organisaatiomalleja; ne löytävät uusia AI-kyvykkyyksille optimoituja.
Rakentajille tämä tarkoittaa suunnittelua emergenssiä varten kontrollin sijaan. Voittavat kehykset ovat niitä, jotka tarjoavat juuri tarpeeksi rakennetta itsejärjestäytymiselle pysyen samalla poissa luonnollisten koordinaatiomallien tieltä.
Koodin jälkeinen aikakausi ei ole vain AI:ta kirjoittamassa ohjelmistoja. Se on AI:ta löytämässä uusia tapoja organisoida itse työtä. Ja todisteet viittaavat siihen, että minimaalinen rakenne, ei maksimaalinen kontrolli, avaa tuon potentiaalin.
Lähteet
- https://arxiv.org/abs/2603.28990
- https://arxiv.org/abs/2603.25928
- https://arxiv.org/abs/2510.05174
- https://arxiv.org/abs/2602.01011
- https://arxiv.org/abs/2512.00740
- https://towardsdatascience.com/why-your-multi-agent-system-is-failing-escaping-the-17x-error-trap-of-the-bag-of-agents
- https://ai.gopubby.com/your-multi-agent-framework-is-an-anti-pattern-25-000-tasks-prove-that-pre-assigned-roles-make-ai-e6ea31736ebd
- https://x.com/awagents/status/2039437848030347310
Haluatko syventyä?
Tutkimme tekoälyllä rakennetun ohjelmiston eturintamaa itse rakentamalla. Katso mihin olemme paneutuneet.