NVIDIA他が長い動画を理解する視覚言語モデル『LongVILA』開発、画像とテキストを1つのモデルで統一する『Show-o』など生成AI技術5つを解説(生成AIウィークリー) 2024/9/1 未分類