Az Andon Labs kísérlete szerint távol állnak a mai nagy nyelvi modellek a megbízható valós működéstől. Robotporszívókba építve egy egyszerű "add át a vajat" feladaton buktak el sorra. Az eredmények rávilágítanak: az LLM-ek szövegben erősek, de a fizikai világban még messze nem robotok.