El equipo de Li Fei-Fei aclara el concepto de 'modelo del mundo'. Sora solo es un renderizador.
L'equip de la professora Fei-Fei Li de Stanford i World Labs ha publicat un article que aclareix la confusió del terme "model del món" en IA. Proposen una taxonomia basada en el procés de decisió de Markov parcialment observable, dividint els sistemes en tres funcions: **renderitzadors**, **simuladors** i **planificadors**.
Els **renderitzadors** (com Sora d'OpenAI o Google Genie 3) generen vídeos o imatges realistes per a humans però no simulen física precisa. Els **simuladors** (com NVIDIA Omniverse) prediuen estats físics futurs exactes per a càlculs, com en simulacions digitals. Els **planificadors** prenen decisions sobre accions per a robots o sistemes autònoms.
L'article argumenta que la majoria de models anomenats "model del món" només són renderitzadors. Sora, per exemple, no pot predir com canvia un estat amb una acció específica, només continua seqüències visuals. Aquesta clarificació és crucial per a decisions tècniques, inversores i d'investigació, ja que evita confondre la generació d'imatges atractives amb una comprensió real de la física o capacitats de planificació. El futur passa per la integració d'aquestes tres funcions.
marsbitHace 13 hora(s)