一本色道久久综合亚州精品蜜桃,2017av无码免费无线播

來源: 機(jī)器之心

作者：鐘格非（港中文深圳本科生）

(資料圖片僅供參考)

港中文（深圳）“鳳凰 “多語言大模型，中文效果逼近文心一言，多種語言開源 SOTA；英文版”Chimera” 逼近 ChatGPT（GPT4 評(píng)測認(rèn)為其有 96% GPT 3.5 Turbo 效果），數(shù)據(jù)模型訓(xùn)練將全開源。

背景介紹

ChatGPT 和 GPT-4 的問世，被比爾?蓋茨譽(yù)為自 1980 年以來最大的科技革命。近日，相關(guān)技術(shù)和科研以 "天" 為單位快速迭代，每天都有新的類似 ChatGPT 的模型發(fā)布。其中包括 Alpaca、Vicuna、Dolly、Belle、Baize、 Guanaco 和 LuoTuo 等。

近期備受關(guān)注的是來自香港中文大學(xué)（深圳）和深圳市大數(shù)據(jù)研究院的王本友教授團(tuán)隊(duì)開發(fā)的 Phoenix（鳳凰）和 Chimera 等開源大語言模型，其中文效果接近百度文心一言，GPT-4 評(píng)測達(dá)到了 97% 文心一言的水平，在人工評(píng)測中五成不輸文心一言。

此外，維護(hù) Phoenix 和 Chimera 大模型的 github 倉庫取名為 “LLM 動(dòng)物園”，其中還包括其他相關(guān)即將發(fā)布的模型，如醫(yī)療領(lǐng)域的華佗 GPT 模型（huatuogpt.cn）、法律 GPT 模型、多模態(tài)大模型和檢索增強(qiáng)的大模型等。具體請(qǐng)見其 Github 主頁的技術(shù)報(bào)告。

項(xiàng)目地址：https://github.com/FreedomIntelligence/LLMZoo

名字的哲學(xué)：鳳凰和奇美拉

阻礙大模型發(fā)展最大的瓶頸是沒有足夠的候選名稱可用于命名語言模型，LLAMA、Guanaco、Vicuna 和 Alpaca 已經(jīng)被使用了，而且駱駝家族中已經(jīng)沒有更多的成員了。王本友教授團(tuán)隊(duì)將多語言的大模型命名為 “鳳凰”。在中國文化中，“鳳凰” 通常被視為鳥類之王的象征。正如成語所說，“百鳥朝鳳”，表明它能夠與說不同的語言的鳥類溝通，稱鳳凰為能夠理解和說出數(shù)百種（鳥類）語言的模型。更重要的是，“鳳凰” 是 “香港中文大學(xué)（深圳）”（CUHKSZ）的圖騰，開發(fā)團(tuán)隊(duì)來自這個(gè)高校。

專門針對(duì)拉丁語的 “鳳凰” 版本被稱為 “奇美拉”。奇美拉是希臘神話中類似的混合生物，由來自利基亞和小亞細(xì)亞的不同動(dòng)物部分組成。鳳凰和奇美拉分別代表了東方和西方文化的傳說生物。將它們放在一個(gè)動(dòng)物園里，以期望東西方人民之間共同協(xié)作，來平民化 ChatGPT，共同打破 Open (close) AI 的 AI 霸權(quán)。

鳳凰的技術(shù)特點(diǎn)

Phoenix 模型有兩點(diǎn)不同之處：

（1）微調(diào)技藝：指令式微調(diào)與對(duì)話式微調(diào)的完美結(jié)合

Phoenix 模型在后訓(xùn)練階段精妙地融合了基于指令的微調(diào)（Instruction-based tuning）與基于對(duì)話的微調(diào)（Conversation-based tuning），實(shí)現(xiàn)了兩者優(yōu)勢的有機(jī)互補(bǔ)。這一結(jié)合使 Phoenix 模型在處理各類問題時(shí)具有更高的靈活性和應(yīng)變能力。以 Alpaca 為代表的基于指令微調(diào)方法能夠使得語言模型嚴(yán)格遵循人類指令，有效滿足用戶的信息需求；以 Vicuna 為代表的基于對(duì)話的微調(diào)方法則能夠提升模型與用戶自然交流的能力，提升用戶的對(duì)話交互體驗(yàn)。鳳凰模型將兩者結(jié)合，不僅提高了模型的實(shí)用性，更增強(qiáng)了其在各種應(yīng)用場景的競爭力。

（2）駕馭多語言：四十余種語言的全球化視野

Phoenix 模型堅(jiān)持擁抱全球化視野，在預(yù)訓(xùn)練（Pre-training）與后訓(xùn)練（Post-training）階段均廣泛運(yùn)用多種語言的訓(xùn)練數(shù)據(jù)。這使得 Phoenix 模型在多語言場景下表現(xiàn)出色，能夠滿足全球使用者的需求。在預(yù)訓(xùn)練階段， Phoenix 模型采用 BLOOM 作為基座模型，相較于僅使用拉丁語系數(shù)據(jù)訓(xùn)練的 LLaMA 模型， BLOOM 模型在包括拉丁語系和非拉丁語系的多種語言訓(xùn)練數(shù)據(jù)上訓(xùn)練而成，因此將其作為基座的鳳凰模型對(duì)于非拉丁語系用戶更加友好。在后訓(xùn)練階段，鳳凰模型的指令數(shù)據(jù)集和對(duì)話數(shù)據(jù)集都涵蓋了超過 40 種語言的訓(xùn)練數(shù)據(jù)，進(jìn)一步拓展了其多語言的支持能力。因此，鳳凰模型不僅在英漢語言上表現(xiàn)卓越，還在已評(píng)測的十余種語言中，相較于其他開源模型具備顯著優(yōu)勢。

實(shí)驗(yàn)結(jié)果

中文

團(tuán)隊(duì)成員采用與 Vicuna 一致的評(píng)測方式，即使用 GPT-4 作為評(píng)估模型，對(duì)鳳凰模型在多種語言中的性能表現(xiàn)進(jìn)行了自動(dòng)評(píng)估。圖中展示了 Phoenix 在中文語境下與流行的中文模型的對(duì)比結(jié)果。Phoenix 超其他流行的中文開源模型（包括 BELLE -7B 和 Chinese-Alpaca-13B 等）。這表明，盡管 Phoenix 是一個(gè)多語言的模型，但在所有開源的中文模型中，它實(shí)現(xiàn)了 SOTA 級(jí)別的性能。與其他開源的模型相似，Phoenix 面對(duì) ChatGPT 和文心一言等閉源大規(guī)模語言模型時(shí)略顯遜色（ChatGLM-6B 未開放數(shù)據(jù)和訓(xùn)練細(xì)節(jié)，只開源了權(quán)重，暫歸為半閉源模型家族），但在效果上已能媲美百度開發(fā)的文心一言，人工評(píng)估中近三成例子比文心一言的輸出更好。

多語言

除了中文，Phoenix 在多種語言上表現(xiàn)優(yōu)異，包括但不限于西班牙語、法語、葡萄牙語、阿拉伯語、日語和韓語，涵蓋了拉丁語系和非拉丁語系的多種語言。這是因?yàn)?Phoenix 在預(yù)訓(xùn)練階段的基座模型、后訓(xùn)練階段的指令式微調(diào)和對(duì)話式微調(diào)三個(gè)方面都采用了多語言的訓(xùn)練數(shù)據(jù)，使得其成為真正意義上的第一個(gè)多語言開源類 ChatGPT 大模型，為非拉丁語系的人群帶來福音。特別地，Phoenix 模型的基座采用 BLOOM 模型，對(duì)商用更加友好，對(duì)普及 ChatGPT 至世界各個(gè)角落，特別是 OpenAI 限制的國家具有顯著意義。想象一下，像燈泡和疫苗等現(xiàn)代科技產(chǎn)品都普及到了幾乎所有發(fā)展中國家，劃時(shí)代的 ChatGPT 同樣應(yīng)惠及全球所有人口，這正是 "democratize ChatGPT" 浪潮的應(yīng)有之意。

英文

英文方面，在使用 GPT-4 進(jìn)行評(píng)測時(shí)，Phoenix-7B 模型的表現(xiàn)超過了 Vicuna-7B 和 ChatGLM-6B，但略遜于 Vicuna-13B。造成這種差距的原因可能有多方面，一方面是模型大小僅為 Vicuna-13B 的一半；另一方面，作者認(rèn)為 Phoenix 是在多語言環(huán)境下訓(xùn)練的，因此額外支付了 “多語言稅”（multi-lingual tax），導(dǎo)致其主語言（英語）的表現(xiàn)不如專門針對(duì)拉丁語言（英文屬于拉丁語言）的 Vicuna-13B。

為了抵消多語言稅的影響，作者將多語言的基座模型（BLOOM）替換為僅包含拉丁語言的 LLaMA 模型，以測試其在拉丁語系，特別是英語上的表現(xiàn)。這個(gè)拉丁語言版的 Phoenix，被稱為 “Chimera”（奇美拉）。再次使用 GPT-4 進(jìn)行測試，Chimera 的表現(xiàn)達(dá)到了 96.6% 的 ChatGPT 水平，略超過 Vicuna-13B 和 BARD 等模型。

人工評(píng)測

雖然上述的自動(dòng)評(píng)測方法源自 Vicuna 的評(píng)測方式，即用 GPT-4 作為評(píng)估模型進(jìn)行評(píng)測，但是使用的評(píng)測數(shù)據(jù)無論是類型還是數(shù)量都是偏少的。出于對(duì)評(píng)估可靠性的進(jìn)一步考慮，香港中文大學(xué)（深圳）的團(tuán)隊(duì)采用人工評(píng)測的方式來評(píng)估中文大模型。人工評(píng)測的結(jié)果與 GPT-4 在中文大模型評(píng)測的結(jié)果高度一致。人工評(píng)估效果順序?yàn)椋篊hatGPT、ChatGLM-6B、文心一言、鳳凰、BELLE 和 Chinese-LLaMA-Alpaca -- 這與 GPT 4 的評(píng)測一樣。這也是首次將 GPT-4 的結(jié)果與人工評(píng)估結(jié)果進(jìn)行比較的研究。

綜上所述，Phoenix 和 Chimera 等開源大語言模型在中文和多種語言環(huán)境下都展現(xiàn)出了優(yōu)異的表現(xiàn)，無論是在中文開源模型中還是在拉丁語系中。這些模型的發(fā)展將有助于推動(dòng) ChatGPT 技術(shù)在全球范圍內(nèi)的普及，讓更多人受益于這一劃時(shí)代的科技成果。

標(biāo)簽：

相關(guān)新聞

GPT-4充當(dāng)評(píng)測老師，效果驚艷，港中文(深圳)開源鳳凰、Chimera等大模型環(huán)球速遞

ChatGPT和GPT-4的問世，被比爾?蓋茨譽(yù)為自1980年以來最大的科技革命。

配50米自動(dòng)尋跡倒車功能北京新X7售11.99萬起

配50米自動(dòng)尋跡倒車功能北京新X7售11 99萬起,座椅,新車,變速箱,網(wǎng)易汽車,隱藏式,門把手

焦點(diǎn)速讀：與糖尿病風(fēng)險(xiǎn)相關(guān)的心率變異性

(健康日)——根據(jù)4月16日在線發(fā)表在《糖尿病護(hù)理》上的一項(xiàng)研究，改變的心率變異性(HRV)可能與亞洲年輕成

新華錦：公司是否增持上海荔之將取決于上海荔之業(yè)績承諾的完成情況等相關(guān)因素

新華錦(600735)04月17日在投資者關(guān)系平臺(tái)上答復(fù)了投資者關(guān)心的問題。

沙伊“北京協(xié)議”顯威，中東九國外長齊聚沙特，又讓美國不高興了環(huán)球動(dòng)態(tài)

自沙伊“北京協(xié)議”之后，中東的天真變了，變晴朗了。當(dāng)?shù)貢r(shí)間4月12日，巴林與卡塔爾代表團(tuán)舉行會(huì)議后同意恢復(fù)外交關(guān)系。當(dāng)天，也門首都薩那的

第41屆香港電影金像獎(jiǎng)揭曉鄭秀文首奪金像獎(jiǎng)最佳女主角

第41屆香港電影金像獎(jiǎng)揭曉鄭秀文首奪金像獎(jiǎng)最佳女主角電影《神探大戰(zhàn)》劇照?qǐng)D據(jù)片方電影《流水落花》劇照?qǐng)D據(jù)片方7次提名，鄭秀文這一次終于奪

央視美女主持人李梓萌：風(fēng)光背后有艱辛，婚戀成父母的心病

在央視工作23年，還一直租房住，除了李梓萌，誰能有她混得慘？不僅如此，在央視臺(tái)里，李梓萌是出了名的工作狂。2000年，李梓萌剛到央視工作，

天天速訊：中國隊(duì)斬獲跳水世界杯西安站全部9項(xiàng)冠軍

中國隊(duì)斬獲跳水世界杯西安站全部9項(xiàng)冠軍4月16日，2023跳水世界杯西安站結(jié)束了最后一個(gè)比賽項(xiàng)目的爭奪。在混合團(tuán)體決賽中，中國隊(duì)以469 35分的

繼續(xù)推薦數(shù)字電力電網(wǎng)、氫能，關(guān)注光熱熔鹽儲(chǔ)能產(chǎn)業(yè)鏈

整體觀點(diǎn)：1 政策規(guī)劃超預(yù)期，重點(diǎn)關(guān)注光熱熔鹽儲(chǔ)能產(chǎn)業(yè)鏈投資機(jī)會(huì)。力爭“十四五”期間，全國光熱發(fā)電每年新增開工規(guī)模達(dá)到300萬千瓦左右不考

上海工商外國語職業(yè)學(xué)院優(yōu)勢專業(yè)有哪些天津師范大學(xué)優(yōu)勢專業(yè)有哪些環(huán)球播資訊

今天，大學(xué)路小編為大家?guī)砹松虾９ど掏鈬Z職業(yè)學(xué)院優(yōu)勢專業(yè)有哪些天津師范大學(xué)優(yōu)勢專業(yè)有哪些，希望能幫助到廣大考生和家長，一起來看看吧

訊景RX 6950 XT顯卡降至4799元，與RTX 4070同價(jià)

IT之家4月15日消息，英偉達(dá)日前推出了RTX4070顯卡，售價(jià)4799元起。AMD尚未發(fā)布對(duì)標(biāo)新品，只是將老款旗艦RX6950XT顯卡降價(jià)，公版降至5099元，訊

百事通！2023上海閔行區(qū)幼兒園報(bào)名時(shí)間表

2023上海閔行區(qū)幼兒園報(bào)名時(shí)間表類別網(wǎng)上報(bào)名時(shí)間網(wǎng)上驗(yàn)證時(shí)間小班幼兒5月11日-5月15日5月16日-5月18日中班大班插班轉(zhuǎn)園幼兒5月26日-5月29日5

電視機(jī)安全使用的注意事項(xiàng) 使用電視機(jī)的注意事項(xiàng)有哪些每日熱點(diǎn)

1、避免連續(xù)、長時(shí)間工作。在不看電視的時(shí)候，最好關(guān)閉顯示器，或者降低其顯示亮度，否則時(shí)間長了，容易導(dǎo)致內(nèi)部燒壞或者老化。另外，長時(shí)間地

女演員表演時(shí)高空墜亡，官方：活動(dòng)已被叫停，相關(guān)情況將通報(bào)-世界快訊

4月15日晚，安徽宿州埇橋區(qū)蒿溝鎮(zhèn)一場演出現(xiàn)場，一名表演高空雜技的女演員在升空過程中突然墜落到舞臺(tái)上，令現(xiàn)場觀眾擔(dān)心不已。目前，當(dāng)?shù)叵嚓P(guān)

每日訊息!鼓勵(lì)上汽等整車企業(yè)參與投資，上海布局汽車芯片出大招

汽車芯片要從單純的國產(chǎn)替代，走向提供基于國產(chǎn)芯片的系統(tǒng)解決方案。

專家“把脈” 助力安全風(fēng)險(xiǎn)隱患排查_世界熱頭條

湖北日?qǐng)?bào)客戶端訊（通訊員李靜樊希）為提高轄區(qū)內(nèi)企業(yè)安全檢查和隱患排查治理水平，確保轄區(qū)安全生產(chǎn)形勢持續(xù)穩(wěn)定，連日來，樊城區(qū)各地邀請(qǐng)專

英語翻譯核心課程系列·口筆譯高頻詞匯詞典_關(guān)于英語翻譯核心課程系列·口筆譯高頻詞匯詞典的簡介

1、《英語翻譯核心課程系列·口筆譯高頻詞匯詞典》是2010年1月1日武漢大學(xué)出版社出版的圖書。本文關(guān)于英語翻譯核心課

世界視點(diǎn)！央行這場會(huì)議出現(xiàn)三大變化！釋放哪些信號(hào)？

同時(shí)，增加了“促進(jìn)政府投資帶動(dòng)民間投資”、“加快完善住房租賃金融政策體系”的表述

【世界熱聞】烤箱烤大蝦的做法_烤大蝦的家常做法

1、前言材料主料：海蝦10只；輔料：奧爾良烤肉料1袋、油5g奧爾良烤大蝦1蝦提前解凍洗凈去除蝦線。2、2用奧爾良烤肉料腌

《黑暗之魂3》DLC艾雷德爾之燼全場景收集流程通關(guān)攻略進(jìn)入DLC艾雷德爾之燼的方法世界球精選

《黑暗之魂3》是硬核動(dòng)作角色扮演游戲系列《黑暗之魂》的正統(tǒng)作品，這部續(xù)作會(huì)由宮崎英高本人擔(dān)任游戲的制作總監(jiān)，本作依然會(huì)貫徹其標(biāo)志性的高

國浩·白嶼林高定發(fā)布會(huì) 解讀品質(zhì)時(shí)代的人居需求

國浩·白嶼林發(fā)布會(huì)，更新中央公園生活體驗(yàn)。低密度純住區(qū)，新加坡花園城市理念，島嶼式園林，全新建筑風(fēng)格，留白體驗(yàn)中心。

歷史上的今天：卓別林誕辰

1889年4月16日，喜劇大師卓別林，出生于英國倫敦南部地區(qū)的一個(gè)演藝家庭。卓別林幼時(shí)貧困，很長一段時(shí)間是流浪兒，在孤兒院、孤兒學(xué)校等地方生

法國政府以法律形式頒布實(shí)行退休制度改革方案_環(huán)球關(guān)注

法國工會(huì)聯(lián)合會(huì)則宣布，將于5月1日舉行新的社會(huì)動(dòng)員反對(duì)退休制度改革，在此日期之前，拒絕和政府舉行對(duì)話

以家人之名中的李尖尖是誰扮演的_扮演者是譚松韻

歡迎觀看本篇文章，小勉來為大家解答以上問題。以家人之名中的李尖尖是誰扮演的，扮演者是譚松韻很多人還不知道，現(xiàn)在讓我們一起

如何一秒“走入”語文書？這位老師用真實(shí)場景帶你沉浸體驗(yàn)課文中的“淚目”瞬間

01:44齊魯網(wǎng)·閃電新聞4月15日訊《超級(jí)語文課第二季》是山東衛(wèi)視、阿爾法蛋聯(lián)合出品，山東衛(wèi)視、唯眾傳媒聯(lián)合制作的大

GPT-4充當(dāng)評(píng)測老師，效果驚艷，港中文(深圳)開源鳳凰、Chimera等大模型環(huán)球速遞

配50米自動(dòng)尋跡倒車功能北京新X7售11.99萬起

焦點(diǎn)速讀：與糖尿病風(fēng)險(xiǎn)相關(guān)的心率變異性

新華錦：公司是否增持上海荔之將取決于上海荔之業(yè)績承諾的完成情況等相關(guān)因素

沙伊“北京協(xié)議”顯威，中東九國外長齊聚沙特，又讓美國不高興了環(huán)球動(dòng)態(tài)

第41屆香港電影金像獎(jiǎng)揭曉鄭秀文首奪金像獎(jiǎng)最佳女主角

央視美女主持人李梓萌：風(fēng)光背后有艱辛，婚戀成父母的心病

天天速訊：中國隊(duì)斬獲跳水世界杯西安站全部9項(xiàng)冠軍

繼續(xù)推薦數(shù)字電力電網(wǎng)、氫能，關(guān)注光熱熔鹽儲(chǔ)能產(chǎn)業(yè)鏈

上海工商外國語職業(yè)學(xué)院優(yōu)勢專業(yè)有哪些天津師范大學(xué)優(yōu)勢專業(yè)有哪些環(huán)球播資訊

訊景RX 6950 XT顯卡降至4799元，與RTX 4070同價(jià)

百事通！2023上海閔行區(qū)幼兒園報(bào)名時(shí)間表

IDC、京東云共同發(fā)布白皮書，揭秘區(qū)域銀行數(shù)字化建設(shè)三大方向

短道速滑名將李佳軍：希望冰雪健兒發(fā)揮出最好的一面

水利部：大力推進(jìn)數(shù)字孿生流域建設(shè) 推動(dòng)新階段水利高質(zhì)量發(fā)展

剛果（金）宣布腦膜炎疫情結(jié)束

水利部：京津冀水資源專項(xiàng)執(zhí)法行動(dòng)成效顯著查處水資源違法案件824件

北京冬奧會(huì)冰壺賽程出爐中國混雙隊(duì)首戰(zhàn)瑞士

落實(shí)“應(yīng)考盡考” 呵護(hù)每一位學(xué)子的讀研夢

肯尼亞總統(tǒng)：中方項(xiàng)目促進(jìn)當(dāng)?shù)匕l(fā)展經(jīng)濟(jì)

首屆中國美人魚表演賽見證新興水上運(yùn)動(dòng)蓬勃發(fā)展

貴州仁懷培養(yǎng)鄉(xiāng)村振興人才中職生“村官”小鄉(xiāng)鎮(zhèn)施展大才華

在黨的旗幟下，為了和平勇毅前行

中國第25批赴剛果（金）維和醫(yī)療分隊(duì)為所屬任務(wù)區(qū)內(nèi)聯(lián)合國人員接種新冠疫苗

首屆西麗湖論壇將在深圳舉辦——“創(chuàng)新·可持續(xù)發(fā)展”

重慶市南川區(qū)隆化六小學(xué)生打破兩項(xiàng)吉尼斯世界紀(jì)錄

特稿：迷霧中跋涉變局中前行——回眸2021年的世界

通訊：“中國是我的第二故鄉(xiāng)”——一位數(shù)次“逆行”的烏茲別克斯坦青年講述他的中國情緣

世衛(wèi)：全球106個(gè)國家和地區(qū)報(bào)告奧密克戎毒株感染病例

尼日利亞銷毀過期阿斯利康新冠疫苗

下行風(fēng)險(xiǎn)積聚歐洲經(jīng)濟(jì)復(fù)蘇前景蒙塵

第一報(bào)道｜推動(dòng)中德、中歐關(guān)系邁上新臺(tái)階習(xí)主席這樣強(qiáng)調(diào)

2021.12【年終報(bào)道·世界面孔】氣候更極端，我們?cè)趺崔k

2021.12【年終報(bào)道·世界面孔】疫情仍兇猛，你們還好嗎

2021.12【年終報(bào)道·世界面孔】硝煙未散盡，他們?nèi)ツ睦?/a>

2021.12 商務(wù)部：希望美方為中美擴(kuò)大貿(mào)易合作創(chuàng)造良好氛圍條件

2021.12原中央防范和處理邪教問題領(lǐng)導(dǎo)小組辦公室副主任彭波受賄案一審開庭

2021.12商務(wù)印書館新書《荀學(xué)新論》出版座談會(huì)在京舉行

2021.12利比亞大選推遲和平前景難期

2021.12中央網(wǎng)信辦開展專項(xiàng)行動(dòng)：打擊流量造假、黑公關(guān)、網(wǎng)絡(luò)水軍亂象

2021.12推動(dòng)退役軍人工作高質(zhì)量發(fā)展 2021年全國退役軍人事務(wù)廳（局）長會(huì)議在京召開

2021.12全國一體化政務(wù)服務(wù)平臺(tái)“助企紓困服務(wù)專區(qū)”上線運(yùn)行

成视频年人黄网站视频福利_欧美日韩国产亚洲精品一级A片_国产精品香蕉成人网_亚洲欧美精品综合一区_亚洲成AV人综合在线观看

GPT-4充當(dāng)評(píng)測老師，效果驚艷，港中文(深圳)開源鳳凰、Chimera等大模型 環(huán)球速遞

GPT-4充當(dāng)評(píng)測老師，效果驚艷，港中文(深圳)開源鳳凰、Chimera等大模型環(huán)球速遞