Visual Genome 與 Open IE 古倫維團隊用兩個不同的知識庫分別產生的故事,No KG代表機器在不添加額外知識時所產生的故事,GLAC是除了古維倫的模型外目前成果最好的模型。由上可知,知識庫的確能幫助故事的上下文連結。最後的Human是真人所寫的故事,包含了許多圖片中沒有的知識,甚至精神性的內容。圖│研之有物(資料來源│古倫維)

訂閱電子報

立即訂閱研之有物電子報,一起探索這世界