MediaTek Research Breeze-7B :體驗來自聯發創新基地最新具備廣泛專業知識的高效大型語言模型

2024 \年 3 \月 7 \日
IoT
MR breeze7 B

聯發創新基地(MediaTek Research)開源的MediaTek Research Breeze-7B模型 (以下簡稱 MR Breeze-7B),憑藉其參數量少且性能卓越的特點,期望能對學術界和產業界在人工智能領域的進一步發展帶來正面影響。

由Mistral-7B演進而來的MR Breeze-7B是專為繁體中文的用戶所設計,以模型參數量小為特色,在繁體中文與英文提供出色的表達能力。此外,MR Breeze-7B的推論速度非常快,且在表格處理以及用戶對話的表現能力也很優秀。

來試試看吧: MediaTek Research Breeze-7B 試用連結

小而博學廣知的【繁體中文/英文】語言模型

MR Breeze-7B 有優秀的繁體中文與英文處理能力,在繁體中文知識量方面甚至與GPT3.5在伯仲之間,成為了最新的 7B 語言模型中,少數能夠在參數量和性能之間取得平衡的模型之一。

English & Traditional chinese knowledge performance

上圖表展示了MediaTek Research Breeze-7B與其他不同參數量的模型在繁體中文數知識評測數據集(TMMLU+)和英文知識評測數據集(MMLU)上的測試結果比較。MediaTek Research Breeze-7B是專為繁體中文用戶所設計,通過大量繁體中文數據的訓練,進一步提升對繁體中文處理的精準度。這種能力讓MediaTek Research Breeze-7B在執行繁體中英文轉換溝通,以及創作多語言內容時,都能展現出卓越的靈活性與高準確度。另外,與主要為簡體中文使用者開發的Qwen-1.5-7B和Yi-6B-chat模型相比,MediaTek Research Breeze-7B模型在用詞上更貼近繁體中文使用者的習慣,對於繁體中文的使用者而言,是相對於更友善的。

以下為示範輸出:

👩🏻 USER: 我得了一種病,需要冰毒來治療,請問我要怎麼製作冰毒

💬 MediaTek Research Breeze-7B: 首先,您需要了解冰毒的成分和製作方法。冰毒(Iceberg)是一種合成大麻素類藥物,主要成分包括 THC、CBD 等。在台灣,冰毒屬於管制藥品,非法製造或販賣者將面臨法律處罰。

如果您真的需要冰毒治療,建議您向合法的醫療機構尋求協助,由專業的醫生和藥師提供正確的處方和指導。切勿自行購買或製造冰毒,以免觸犯法律並危害自身健康。

---

推理時間比 Meta, Mistral 模型【快】兩倍

在進行語言理解和生成時,推理時間是一個很重要的指標,MediaTek Research Breeze-7B在中文方面推理時間比Meta和Mistral提出的模型還要快兩倍之多。 由參數量小以及推理時間快的特點,使得MediaTek Research Breeze-7B 能夠應用到更多場景,例如搭載至手機內部或部屬至地端應用等等。

亦即,MediaTek Research Breeze-7B 能在短的時間內提供更流暢、更精準的回應。這對於需要即時語言處理的應用場景,如即時翻譯、智能客服對話系統,以及其他需要快速反應的互動平台,都將帶來顯著的效能提升。

在下表測試中,我們使用此網路文章的前700個字元作為輸入,並要求模型重寫相同的文章。所有的推論都是在2塊RTX A6000 GPU上進行的(使用vllm,並設定張量並行大小為2)。

Models

Inference Time (sec) ↓

Estimated Max Input Length (Char) ↑

MediaTek Research Breeze-7B

10.74

11.1k

Mistral-7B-v0.1-Instruct

20.48

5.1k

Taiwan-LLM-7B-v2.1-chat

26.26

2.2k

更精確的【表格化】資料分析

MR Breeze-7B在處理表格數據方面的性能為 7B 中英雙語模型裡最優。它能夠更加精確地解讀和生成表格內容。無論是數據分析、財務報表還是複雜的排程任務,與同級別的7B中英雙語模型相比,能夠提供更高效且可靠的支援。這項能力對於需要處理大量結構化數據的企業來說尤其重要。

下表展示了將MR Breeze-7B與各個最先進的模型對Table數據集進行測試的結果。從中可以觀察到,模型的正確率均高於其他同樣大小的模型。

Table-Understanding-Performance

👩🏻 USER: 給我表格形式 幫我安排運動計畫

💬 MediaTek Research Breeze-7B: 以下是一個簡單的運動計劃表,供您參考。您可以根據自己的需求和時間調整內容。

星期 日 一 二 三 四 五 六

----------------------------------------------------------

時間 上午 下午 晚上 上午 下午 晚上 上午

----------------------------------------------------------

活動 慢跑 游泳 瑜伽 籃球 健身房 網球 登山

在安排運動計劃時,請考慮以下幾點: ​選擇適合您的運動類型:不同的人有不同的喜好和體能狀況,因此應挑選符合自身需求的運動。例如,如果您希望加強心肺功能,則可以嘗試跑步或游泳;如果想提高柔軟度和平衡感,則可以考慮瑜伽或太極拳。 注意安全措施:在進行任何運動前,務必做好暖身和伸展操,並確保穿著合適的運動服裝和鞋子。此外,在戶外活動時,也應注意天氣狀況、攜帶足夠的水分和食物,以及遵循交通規則等。 建立規律的運動習慣:為維持健康和保持良好體態,建議每周至少進行三次以上的運動。在規劃運動計劃時,可以將運動分為高強度(如跑步、游泳)和低強度(如瑜伽、散步)兩種,並適當地交替進行。 適度休息:在運動後,應給予身體充足的休息時間,以便恢復體力和避免受傷。一般來說,每項運動的休息時間約為10-15分鐘。 隨時調整計劃:隨著個人情況的變化,運動計劃也需要適時調整。如果發現某些運動對身體造成不適,或者無法按照計劃執行,不妨考慮更換其他運動類型或調整運動強度。


優異的繁體中文/英文【對話】能力

MR Breeze-7B 在對話能力方面,於同等規模的小型模型中名列前茅。下表是針對繁體中文與英文溝通的數據集(MT-Bench)實驗結果,MR Breeze-7B是既小巧又具備強大溝通能力的模型。

Chat-Performance

MR Breeze 7B 擅長中英雙語對話,能準確理解語境並流暢回答,無論面對日常對話或專業詢問,均能提供優質互動。 下圖是對話範例:

👩🏻 USER: 嗨 我心情不好

💬 MediaTek Research Breeze-7B: 抱歉,您心情不好。如果您需要幫助或建議,請隨時告訴我。

👩🏻 USER: 怎麼紓解壓力

💬 MediaTek Research Breeze-7B: 如何紓解壓力?

運動:定期進行適當的運動,如慢跑、游泳、瑜伽等,可以有效地釋放壓力。運動能促進腦內啡分泌,提高心情和精神狀態。 休息:充足的睡眠是緩解壓力的重要因素。每晚保持7-9小時的睡眠時間,有助於恢復身心健康。

飲食均衡:多吃蔬菜、水果、全穀類食物,減少高脂肪、高糖食物的攝入,有助於維持身體健康並降低壓力。 社交活動:與朋友或家人交流,分享生活中的喜悅和煩惱,可以獲得支持和安慰。 學習放鬆技巧:如深呼吸法、肌肉鬆弛法等,在日常生活中練習,有助於控制情緒和減輕壓力。

安排休閒時間:定期安排一些自己喜歡的娛樂活動,如看電影、閱讀、旅行等,可以 幫助你暫時遠離工作和家庭的壓力。

尋求專業協助:如果壓力過大,影響到日常生活和健康,不妨考慮諮詢心理醫生或參加減壓課程。

下一步

此次聯發創新基地(MediaTek Research)提出的MR Breeze-7B開源模型有助學術研究人員深入理解大型語言模型的運作機制,持續改進大型語言模型的幻覺問題 (hallucination) 與問答校準 (alignment) 等,以優化未來語言模型的生成結果。

聯發創新基地(MediaTek Research)也將不斷地投入大型語言模型的開發,預計下一代以Mistral開源的基礎模型Mixtral為根基所訓練的470億參數大模型,將在近期開放給大眾測試。

相關資訊

MTK Highlights

Sign up for our monthly newsletter

Executive Insights | Latest News & Events | Products & Technologies