OpenAI Sora 官網:

我們正在教導人工智慧理解並模擬物理世界的運動,目標是訓練出能幫助人們解決需要與現實世界互動的問題的模型。

介紹 Sora,我們的文字轉影片模型。Sora 能夠生成長達一分鐘的影片,同時保持視覺品質和對使用者提示的遵循。

今天,Sora 開始對紅隊成員開放,以評估關鍵領域的損害或風險。我們也授予了多位視覺藝術家、設計師和電影製作人訪問權,以獲取反饋,了解如何推進模型,使其對創意專業人士最有幫助。

我們提早分享我們的研究進展,以開始與 OpenAI 之外的人合作並獲取反饋,並讓公眾了解人工智慧能力的未來展望。

Sora 能夠生成包含多個角色、特定類型的運動和對主題及背景的準確細節的複雜場景。模型不僅理解用戶在提示中要求的內容,還理解這些事物在物理世界中的存在方式。

模型對語言有深刻的理解,使其能夠準確解讀提示並生成表達豐富情感的引人入勝的角色。Sora 也可以在單個生成的影片中創建多個鏡頭,準確地保留角色和視覺風格。

目前的模型有缺點。它可能在準確模擬複雜場景的物理性質方面存在困難,並且可能不理解特定實例的因果關係。例如,一個人可能會咬一口餅乾,但之後,餅乾可能沒有咬痕。

模型也可能混淆提示的空間細節,例如,搞混左右,並且可能在準確描述隨時間發生的事件方面存在困難,比如遵循特定的攝影機軌跡。

感想:以前受限於工具,只有文字是最經濟有效的思考語言。現在和未來,圖像、影音肯定也會成爲經濟有效的思考語言。我們準備好了嗎?

什麼是思考語言?

思考語言Thought language)是一個抽象的概念,它指的是個體在思考過程中使用的內部語言或是心智表示形式。這個概念可以從多個角度來理解:

1. 認知心理學:在認知心理學領域,思考語言被視為是人們在思考、解決問題或進行創造性思維時使用的內部溝通方式。它不一定對應於任何具體的自然語言(如英語或中文),而是一種更為基本的思維方式,可能包括圖像、符號、概念等非語言形式。

2. 哲學:在哲學領域,特別是心靈哲學和語言哲學中,思考語言的概念被用來探討思想和語言之間的關係。有些理論家認為,所有的思考活動都是以某種語言形式進行的,即所謂的“心靈語言”(mentalese),而其他人則認為思考可以獨立於語言存在。

3. 人工智能:在人工智能領域,思考語言可能被用來指代機器或算法在處理、分析和生成語言或其他形式的資訊時所使用的內部表示系統。這些系統旨在模擬人類的思考過程,以實現理解、學習和創造。

總的來說,思考語言是一個跨學科的概念,涉及語言、心理學、哲學和人工智能等多個領域。它挑戰了我們對思考、語言和認知的理解,引發了關於思維過程本質的深入討論。

 

以上三個 OpenAI Sora 生成之影片轉址至:

cdn.openai.com/sora/videos/tokyo-walk.mp4
cdn.openai.com/sora/videos/wooly-mammoth.mp4
cdn.openai.com/sora/videos/big-sur.mp4

Leave a Reply