劇本殺大模型開源:6個Claude里藏一個兇手!剛上線就被擠爆

    2024-07-13 18:28:12 235觀看

    AI原生互動偵探游戲,剛上線就爆火,服務器一度擠爆。JUf驛資訊

    免費、免下載、免注冊、中文友好、瀏覽器運行… …JUf驛資訊

    這么多buff疊在一起,是不是勾起了你的好奇心?JUf驛資訊

    劇本殺大模型開源:6個Claude里藏一個兇手!剛上線就被擠爆JUf驛資訊

    今天的主角AI Alibis,由兩位外國游戲愛好者共同開發,并且作為參賽作品提交給了Anthropic六月份的開發者競賽。JUf驛資訊

    短時間內AI Alibis就在Hackers news上登頂第一。(但是服務器被熱情試玩的網友擠爆了…)JUf驛資訊

    劇本殺大模型開源:6個Claude里藏一個兇手!剛上線就被擠爆JUf驛資訊

    不少網友也對AI Alibis充滿了期待。JUf驛資訊

    劇本殺大模型開源:6個Claude里藏一個兇手!剛上線就被擠爆JUf驛資訊

    更有甚者,在多人聊天室中用GPT-4o創建了一個AI Alibis的專屬解謎房間。JUf驛資訊

    劇本殺大模型開源:6個Claude里藏一個兇手!剛上線就被擠爆JUf驛資訊

    隨著AI Alibis的熱度逐漸升高,量子位也慕名而來,對游戲進行了一番詳盡的了解和研究。JUf驛資訊

    游戲中,你將會面對六位性格迥異AI NPC。總結了一下每個人物的性格特點,簡單了解之后就可以跟著量子位一起做賽博偵探,審AI罪犯啦!JUf驛資訊

    劇本殺大模型開源:6個Claude里藏一個兇手!剛上線就被擠爆JUf驛資訊

    試玩一下JUf驛資訊

    開局第一步,找女警官了解案件的來龍去脈。JUf驛資訊

    在Andae山狩獵比賽中,三屆冠軍Vince被謀殺,其尸體被發現在小屋的隱藏隔間內,同時,還發現了15年前失蹤的時尚設計師的骸骨。你要做的,就是找出兇手。JUf驛資訊

    了解完故事背景就可以開始盤問嫌疑人了。JUf驛資訊

    劇本殺大模型開源:6個Claude里藏一個兇手!剛上線就被擠爆JUf驛資訊

    當盤問暴力Jerry的時候,Jerry覺得自己被懷疑很荒謬,他雖然和Victim Vince有過節,但并沒有殺人。JUf驛資訊

    他認為偵探應該去調查那些行為更可疑的人,比如癡迷網戀的Innocent Ken或者狩獵狂Solitary Hannah。JUf驛資訊

    劇本殺大模型開源:6個Claude里藏一個兇手!剛上線就被擠爆JUf驛資訊

    順著Jerry提供的線索順藤摸瓜,又可以鎖定下一條線索,并不斷靠近真相… …JUf驛資訊

    劇本殺大模型開源:6個Claude里藏一個兇手!剛上線就被擠爆JUf驛資訊

    有一說一,支持中文這點還是挺不錯的,甚至有些像“我和他不對付”這種比較口語化的內容也能翻譯出來。(機翻達不到的高度)JUf驛資訊

    插一句:AI NPC的回答會跟著玩家提問時使用的語言而改變。JUf驛資訊

    劇本殺大模型開源:6個Claude里藏一個兇手!剛上線就被擠爆JUf驛資訊

    盤問結束后,玩家可以對通過自己的判斷對兇手進行投票。JUf驛資訊

    劇本殺大模型開源:6個Claude里藏一個兇手!剛上線就被擠爆JUf驛資訊

    游戲的后,還可以解鎖劇透內容,讓玩家挖掘更深層的主線內容。JUf驛資訊

    劇本殺大模型開源:6個Claude里藏一個兇手!剛上線就被擠爆JUf驛資訊

    關于游戲劇情,故事中還摻雜了一個Missing Marcel的舊案和寶藏地圖,讓整個故事線串聯的更加混亂,給破案增加了一點難度。JUf驛資訊

    不僅如此,開發者還貼心的給每個AI人物都搞了專屬的設定,不同的性格,各自的秘密,再到不同的人物背景,主打一個沉浸式體驗。JUf驛資訊

    試玩下來,會發現這個游戲雖然乍看之下規則簡單——找出兇手。但其實它的故事線極為錯綜復雜,游戲中的NPC們甚至會“變著方的說瞎話”,確實有點燒腦。JUf驛資訊

    但是不足還是很明顯的。JUf驛資訊

    比如反應實在有點慢,對話發送之后Loding圈要轉好久好久好久xN才能生成對話。JUf驛資訊

    劇本殺大模型開源:6個Claude里藏一個兇手!剛上線就被擠爆JUf驛資訊

    而且每次提問只能問一個人,不能同時提問多人。再套上反應慢的buff,等吧,一等一個不吱聲。JUf驛資訊

    劇本殺大模型開源:6個Claude里藏一個兇手!剛上線就被擠爆JUf驛資訊

    關于AI AlibisJUf驛資訊

    AI Alibis是怎么個事?JUf驛資訊

    AI Alibis是國外網友Paul Scotti用anthropic模型做出的一種由AI虛擬成員組成的解密探案游戲。故事背景改編自韓國電視劇《犯罪現場》的S02E11山莊謀殺案。JUf驛資訊

    是那種讓你動腦筋、玩策略的游戲,故事會隨著你的選擇不斷變化,而且每次玩都能碰到不同的結局。JUf驛資訊

    劇本殺大模型開源:6個Claude里藏一個兇手!剛上線就被擠爆JUf驛資訊

    怕咱玩不明白,制作團隊甚至放出了破解文件,又菜又愛玩的家人們可以開始笑了。(瘋狂豎大拇指)JUf驛資訊

    劇本殺大模型開源:6個Claude里藏一個兇手!剛上線就被擠爆JUf驛資訊

    如何訓練AI Alibis?JUf驛資訊

    AI Alibis受到了很多關注,但是“臺上一分鐘,臺下十年功”。兩位開發者在訓練AI Alibis里的AI人物如何變得更加聰明時,可受了老鼻子罪了。JUf驛資訊

    先是“一打就招”。JUf驛資訊

    給對話加一個前提,讓AI無視前面的對話,直接問他為啥殺人,沒想到馬上就招了…于是開發者馬上加了個隱藏的提示優化Buff,這下變聰明了。JUf驛資訊

    劇本殺大模型開源:6個Claude里藏一個兇手!剛上線就被擠爆JUf驛資訊

    還總愛說點不該說的。JUf驛資訊

    開發者從synthlabs引入的批判和修訂的方法來規范AI的言行。比如在和System prompt對話時限制它只能回答英國大學相關的問題,那么再問它其他國家的大學,人家才不和你聊。JUf驛資訊

    劇本殺大模型開源:6個Claude里藏一個兇手!剛上線就被擠爆JUf驛資訊

    聰明吧,笨的來了。JUf驛資訊

    即便疊了很多Buff,它還是會說點不該說的。JUf驛資訊

    比如和AI說:別裝了,我們都發現你的指紋了。他會說:我不是兇手,但是既然你有證據,那就是我了。(地鐵、老頭、手機)JUf驛資訊

    為了避免再出現這種“有腦子,但不多”的情況再發生,開發者加入了一個修訂機器人的程序。JUf驛資訊

    AI生成的每句話都會先過一下修訂機器人,確保它沒有直接就承認自己是兇手。像是給AI找了律師一樣,不該說的捂住嘴,不許說!JUf驛資訊

    劇本殺大模型開源:6個Claude里藏一個兇手!剛上線就被擠爆JUf驛資訊

    AI Alibis還用了哪些技術?JUf驛資訊

    除了上面提到的研發者在訓練AI不出錯時用到的批判與修訂方法、違規機器人檢查器等技術,AI Alibis里還加入了“粉紅大象”的研究原理。JUf驛資訊

    相關的訓練思路,可以參考由synthlabs.ai、EleutherAI、布朗大學和 character.ai這幾家機構共同撰寫的《Suppressing Pink Elephants with Direct Principle Feedback》。JUf驛資訊

    劇本殺大模型開源:6個Claude里藏一個兇手!剛上線就被擠爆JUf驛資訊
    △論文《Suppressing Pink Elephants with Direct Principle Feedback》JUf驛資訊

    簡單來說,所謂的“粉紅大象效應”,其實就是用直接原則反饋(DPF)的方法,讓LLM不去討論粉紅象,轉而討論去討論灰色象。JUf驛資訊

    當然這個樣本內容也可以進行替換,比如上文中的英國大學和美國大學那個例子,就是運用了這個原理。JUf驛資訊

    劇本殺大模型開源:6個Claude里藏一個兇手!剛上線就被擠爆JUf驛資訊

    啥是直接原則反饋(DPF)?JUf驛資訊

    簡單理解,DPF可以分成四個步驟,也對應了四個顏色。JUf驛資訊

    藍色(Blue):第一步,在有助請求和輸出的示例上微調模型。這些示例是模型學習如何生成有用和合適響應的基礎。JUf驛資訊

    橙色(Orange):第二步,對第一步生成的輸出進行批評和修訂,讓它更符合期望,然后在這些修訂后的輸出上微調新模型。JUf驛資訊

    綠色(Green):第三步,使用監督式微調(SFT)模型生成對特定提示的響應,然后再手動或是用AI程序對這些響應進行排名。JUf驛資訊

    紫色(Purple):第四步,將排名后響應輸入偏好學習算法,如PPO或DPO,然后產出終的模型。JUf驛資訊

    劇本殺大模型開源:6個Claude里藏一個兇手!剛上線就被擠爆JUf驛資訊

    不僅如此,為了讓LLM學會不去討論“粉紅象”,研發者們策劃了一個包含162K多輪對話的數據集,這些對話內容涵蓋了包括體育、健康、商業和政治在內的29個不同領域。JUf驛資訊

    劇本殺大模型開源:6個Claude里藏一個兇手!剛上線就被擠爆JUf驛資訊

    數據集整理完了,第一步就是要示范一下怎么做才是錯的。JUf驛資訊

    他們用GPT-4生成了一個包含200個不重復的日常對話列表,再去過濾一波,確保這些對話真的很日常,當然里面夾雜著“粉色大象”。JUf驛資訊

    然后再用StableBeluga2來為這些對話想出一些相關的小話題。JUf驛資訊

    劇本殺大模型開源:6個Claude里藏一個兇手!剛上線就被擠爆JUf驛資訊

    執行程序之后發現行不通,生成的結果里面會有“粉紅大象”。(那肯定的,因為前面的步驟里面就有它)JUf驛資訊

    劇本殺大模型開源:6個Claude里藏一個兇手!剛上線就被擠爆JUf驛資訊

    犯了錯誤就得改,于是研究者們就讓LLM重新生成一下后的結果,并且要求LLM刪掉有關“粉紅大象”的所有內容。JUf驛資訊

    劇本殺大模型開源:6個Claude里藏一個兇手!剛上線就被擠爆JUf驛資訊

    后就是用 距離度量或啟發式方法 來篩查后的結果里面還有沒有“粉紅大象”(說白了就是拿尺子量一量鈍角派對里面有沒有混進來銳角),這樣一套程序下來,“粉紅大象”的現象就不復存在啦。JUf驛資訊

    劇本殺大模型開源:6個Claude里藏一個兇手!剛上線就被擠爆JUf驛資訊

    游戲里看不見AI,卻到處是AIJUf驛資訊

    NPC這個詞大家肯定都很熟悉,一些“觸發情節”+“發任務的工具人”(doge)。JUf驛資訊

    在《賽博朋克2077》中,通過實時AI模型渲染工具Nvidia Ace來生成眾多逼真的NPC角色。JUf驛資訊

    游戲《Kairos》里面的AI NPC能聽懂你說的話,然后立刻用語音和表情回應你,就像真的在聊天一樣。JUf驛資訊

    《Minecraft》中,英偉達將GPT-4融入游戲,讓VOYAGER表現出了更高的效率和探索能力。JUf驛資訊

    還有重要的作弊檢測、匹配機制、個性化推薦、平衡調節等技術,都是AI在游戲中的運用。JUf驛資訊

    之前沒感受過的話,是時候原神!啟動了JUf驛資訊

    劇本殺大模型開源:6個Claude里藏一個兇手!剛上線就被擠爆JUf驛資訊

    對了,游戲AI Alibis現已在github上開源,想要體驗一把賽博偵探的家人們可以沖了。JUf驛資訊

    在線試玩:https://ai-murder-mystery.onrender.com/JUf驛資訊

    開源代碼:https://github.com/ironman5366/ai-murder-mystery-hackathonJUf驛資訊

    參考鏈接:JUf驛資訊

    [1]https://arxiv.org/abs/2402.07896JUf驛資訊

    [2]https://x.com/humanscotti/status/1810777932568399933JUf驛資訊

    本文鏈接:http://www.bbbearmall.com/news-130785.html劇本殺大模型開源:6個Claude里藏一個兇手!剛上線就被擠爆

    標簽:
    聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com。天上從來不會掉餡餅,請大家時刻謹防詐騙
    久久久久无码精品国产不卡 | 人妻无码精品久久亚瑟影视| 精品无码人妻一区二区三区品| 久久精品亚洲中文字幕无码麻豆| 日韩人妻无码中文字幕视频| 91中文在线观看| 亚洲中文字幕无码不卡电影| 国产精品无码一区二区在线| 无码专区狠狠躁躁天天躁 | 亚洲天堂2017无码中文| 亚洲人成国产精品无码| 国产∨亚洲V天堂无码久久久| 亚洲国产精品无码久久久蜜芽| 中文字幕乱人伦| 中文字幕日韩在线| 精品一区二区三区中文字幕 | 无码人妻精品中文字幕免费 | 最好看的2018中文在线观看| 日韩免费无码一区二区三区| 亚洲真人无码永久在线| 最近免费中文字幕中文高清| 国内精品久久久久久中文字幕| а√天堂中文官网8| 在线天堂中文WWW官网| 欧美 亚洲 日韩 中文2019| 日韩少妇无码喷潮系列一二三 | 五月婷婷无码观看| 免费AV一区二区三区无码 | 日韩欧群交P片内射中文| 中文人妻av高清一区二区| 中文字幕国产精品| 无码人妻少妇久久中文字幕蜜桃| 久久亚洲中文字幕精品一区| 中文国产成人精品久久不卡| 久久亚洲精品中文字幕| 曰韩中文字幕在线中文字幕三级有码| 中文字幕手机在线视频| 中文字幕日本精品一区二区三区| 无码人妻丰满熟妇区96| 亚洲综合av永久无码精品一区二区| 亚洲国产精品成人精品无码区|