商湯大語言模型應(yīng)用“商量SenseChat”即日起全面向廣大用戶開放服務(wù)

2023-08-31 19:23:51 來源:證券時(shí)報(bào)網(wǎng)


(資料圖)

8月31日,商湯科技日日新大模型旗下自然語言應(yīng)用“商量SenseChat”正式面向廣大用戶開放服務(wù)。

商湯“商量SenseChat”今年4月正式推出,是國內(nèi)最早的基于千億參數(shù)大語言模型之一,并不斷迭代更新。目前,基模型為商湯聯(lián)合多家國內(nèi)頂級(jí)科研機(jī)構(gòu)發(fā)布的書生·浦語InternLM-123B,擁有1230億參數(shù),在語言、知識(shí)、理解、推理和學(xué)科五大能力上均處于行業(yè)領(lǐng)先水平,并在全球51個(gè)知名評(píng)測集(包括MMLU, AGIEVAL, ARC, CEval, Race, GSM8K等)共計(jì)30萬道問題集合上測試成績整體排名全球第二,超過GPT-3.5-turbo以及Meta新發(fā)布的LLaMA2-70B等模型,在主要評(píng)測中12項(xiàng)成績超越GPT-4,排名第一。

商量SenseChat背后依托商湯AI大裝置SenseCore,其上線GPU數(shù)量由2023年3月底的27,000塊提升至日前的約30000塊,算力規(guī)模提升20%至6 ExaFLOPS,可有效支持語言大模型的訓(xùn)練、升級(jí)迭代和服務(wù)。

在訓(xùn)練數(shù)據(jù)方面,商湯每月可產(chǎn)出約2萬億token的高質(zhì)量數(shù)據(jù),支持更加強(qiáng)大的基模型的訓(xùn)練,預(yù)計(jì)年底高質(zhì)量數(shù)據(jù)儲(chǔ)備將突破10萬億token。同時(shí),商湯還投入了數(shù)百臺(tái)服務(wù)器搭載千卡GPU的計(jì)算資源,采用算法結(jié)合人工的方法對(duì)原始語料數(shù)據(jù)進(jìn)行分門別類的精細(xì)化清洗,以確保數(shù)據(jù)的質(zhì)量、安全性和價(jià)值觀都符合要求。

截至目前,商湯商量在金融、醫(yī)療、汽車、地產(chǎn)、能源、傳媒、工業(yè)制造等眾多垂直行業(yè)與超過500家客戶建立了深度合作,通過提供多種靈活的API接口和服務(wù),為客戶提供大模型的各項(xiàng)AI技術(shù)和服務(wù),低門檻、低成本、高效率地實(shí)現(xiàn)各類生成式AI應(yīng)用。

商湯“日日新SenseNova”大模型體系和生成式AI產(chǎn)品系列,包括商量、秒畫、如影、瓊宇、格物,分別對(duì)應(yīng)著自然語言交互、AI文生圖、數(shù)字人、3D大場景重建、3D小物體生成這五個(gè)主流的生成式AI應(yīng)用。

未來,商湯將依托強(qiáng)大的基模型,以及在算力、數(shù)據(jù)、算法基礎(chǔ)上的積累和豐富Know-how,持續(xù)升級(jí)商湯日日新大模型體系下的多種生成式AI產(chǎn)品,滿足各類用戶的需求。

標(biāo)簽:

上一篇:長城證券:政策扶持氫能產(chǎn)業(yè)放量 應(yīng)用端滲透率不斷提升
下一篇:最后一頁
產(chǎn)品
更多
概念
平臺(tái)
應(yīng)用