在哲學和文學的討論中,個體的存在從來不是靜態不變的。而當我們從現實世界移動到虛擬空間,這種存在的流動性變得更加明顯。最近在閱讀We Are Data: Algorithms and The Making of Our Digital Selves 《數據失控:算法時代的個體危機》時,裡面提到一個有趣的比喻和可能性:要是把真實個體(Real Individual)和雲端個體(Cloud Individual)之間的關係,想像成芝諾的二分法悖論,會怎麼樣? 這個想法,意外地不只可以用來理解個體本身,還可以延伸到——友誼這種社會關係的變化。 1. The Else:真實與虛擬之間的異質地帶 在許多文化理論中,「the else」這個概念指向一種異質、未被完全吸收或定義的存在。它不像「他者」(other)那樣被固定對立,而是保持著某種流動、不確定、未完成的特性。 然而,無論如何轉化,總有某些部分——某些限制、某些記憶、某些異質性——無法被完全同化或抹除。這就是「the else」的存在。 2. 芝諾的二分法悖論:無窮逼近,卻無法抵達 芝諾(Zeno)提出過一個著名的悖論: 要從城市A移動到城市B,必須先走到中途;到了中途,又得先走剩餘距離的一半;如此無限細分,你永遠無法真正抵達B。 如果把真實個體當成A,雲端個體當成B,那麼從A到B的過程就是一場無止境的旅程。 這種無窮逼近但永遠未完成的狀態,正是「the else」不斷生成的場域。 3. 友誼的芝諾式旅程:從現實到雲端 這個模型其實可以自然地擴展到個體之間的連結——也就是友誼(Friendship)。 在數位時代,我們越來越多地經歷著從真實友誼到雲端友誼的過渡。 而這個缺口,同樣就是the else——那個既不是純粹真實,也不是純粹虛擬的模糊地帶。 4. Dogeaters 中的旅程:酷兒流浪學的閃爍地帶 在Jessica Hagedorn的小說 Dogeaters,角色們也在經歷類似的狀態: 這就是酷兒流浪學(queer nomadology)所捕捉的: 在固定與流動、現實與想像、肉身與虛擬之間無盡漂移的存在狀態。 角色之間的聯繫、愛情、甚至革命聯盟,從來不是穩固的,而是總在「the else」中閃爍、變形。 5. 小結:個體、友誼,與不可抵達的地平線 無論是個體本身,還是個體之間的友誼,在這個從真實到雲端的無限旅程中,我們都在不斷生成「the else」——一種既是渴望也是疏離的存在。 “Friendship, like the individual, inhabits […]
Tag: 資料科學
探索多語言手語生成的新紀元
在現代科技迅猛發展的時代,我們見證了語言模型在各種應用中的卓越表現。然而,手語這一重要的溝通工具在數據科學領域的研究卻相對較少。鑒於全球有數百萬的聾啞人士依賴手語進行日常交流,如何利用人工智慧技術提升手語的生成和翻譯成為了一個亟需解決的問題。本文介紹了一項突破性的研究工作,提出了首個全面的多語言手語資料集——Prompt2Sign,並基於此資料集開發了首個多語言手語生成模型——SignLLM。 SignLLM模型不僅能夠從文本或提示生成精確的手語手勢,還能支持美國手語(ASL)以及德國手語、瑞士德國手語、瑞士法國手語、瑞士義大利手語、阿根廷手語、韓國手語和土耳其手語等八種手語。這一創新模型結合了基於強化學習的損失函數和模塊設計,顯著加速了模型的訓練過程,並在多語言手語生成任務中達到了最先進的性能。 在這篇文章中,我們將深入探討Prompt2Sign資料集的構建過程及其獨特性,並詳細介紹SignLLM模型的設計原理和技術創新。我們相信,這項研究不僅為手語生成和翻譯技術帶來了新的突破,也為未來的多語言手語研究奠定了堅實的基礎。讓我們一同走進這個充滿潛力和希望的領域,探索手語生成的新紀元。 手語模型的建立與其他語言模型的不同之處 SignLLM模型的建立方式與其他語言模型有幾個顯著的不同之處: SignLLM模型的創新之處在於其多語言支持和強化學習的應用,使其能夠更有效地處理大規模、多語言的手語數據,並且在多語言手語生成任務中達到了最先進的性能。 未來應用 SignLLM模型的未來應用潛力巨大,特別是在以下幾個方面: SignLLM的多語言支持和強化學習能力,使其在上述各個領域中具有廣泛的應用潛力,並為聽障人士創造了更多的機會和便利。 Fang, S., Wang, L., Zheng, C., Tian, Y., & Chen, C. (2024). SignLLM: Sign Languages Production Large Language Models. arXiv preprint arXiv:2405.10718. https://doi.org/10.48550/arXiv.2405.10718