幻方發(fā)布第二代MoE 模型DeepSeek-V2,綜合性能位列第一梯隊(duì)。
2024 年5 月6 日,幻方發(fā)布第二代MoE 模型DeepSeek-V2。在AlignBench、MT-Bench、MMLU 等多個(gè)benchmark 上表現(xiàn)出色,其中AlignBench 在開源模型中居首位,與GPT-4-Turbo,文心4.0 比肩。MTBench超過最強(qiáng)MoE 開源模型Mixtral 8x22B。
繼今年1月份開源國(guó)內(nèi)首個(gè)MoE模型后,幻方人工智能公司最新推出了第二代MoE模型——DeepSeek-V2。這款新模型不僅參數(shù)更多、性能更強(qiáng),訓(xùn)練成本更低的特點(diǎn),令其在業(yè)界引起廣泛關(guān)注。 DeepSeek-V2采用了創(chuàng)新的模型架構(gòu)和訓(xùn)練方法,在多項(xiàng)綜合評(píng)測(cè)中均表現(xiàn)出色,有些指標(biāo)甚至媲美或超越目前最強(qiáng)的GPT-4模型。同時(shí),它的推理效率和部署成本也大幅優(yōu)于同類大模型,可謂是性能與成本的完美結(jié)合。
相關(guān)標(biāo)的:
$每日互動(dòng) sz300766$ :幻方二股東,技術(shù)負(fù)責(zé)人是每日互動(dòng)的聯(lián)合創(chuàng)始人,存在合作基礎(chǔ)。
$卓創(chuàng)資訊 sz301299$ :幻方作為大型私募,卓創(chuàng)資訊金融語料庫(kù)。
$陽光照明 sh600261$ :購(gòu)買幻方3億產(chǎn)品,疊加電器出海,外銷占比75%。
$飛利信 sz300287$ :飛利信是目前市場(chǎng)采用MLA機(jī)制不多的上市公司,Multi-headlatent attention,就是多頭注意力機(jī)制,簡(jiǎn)稱MLA。
$南威軟件 sh603636$ :在人工智能方面,基于多頭注意力機(jī)制和增強(qiáng)特征金字塔方法,掌握了新型的生物認(rèn)證技術(shù)。
聯(lián)系客服