2024-10-11 15:20
热度 0

Chainbase 开源首个加密领域大模型 Theia-Llama-3.1-8B ,性能超越主流模型

摘要
神经日报 10月11日消息,全链数据网络 Chainbase 近日宣布在 HuggingFace 开源其专为加密领域打造的大语言模型 Theia-Llama-3.1-8B 。该模型在困惑度(Perplexity)和 BERT 评分上均超越了市场主流模型,对crypto世界的理解能力超过大多主流开源大模型。Chainbase 团队独创性地构建了首个专业 Web3 数据集,收录了 CoinMarket

神经日报 10月11日消息,全链数据网络 CHainBase 近日宣布在 HUGgingFAce 开源其专为加密领域打造的大语言模型 Theia-LLama-3.1-8B 。该模型在困惑度(PerPLEXity)和 BERT 评分上均超越了市场主流模型,对crypto世界的理解能力超过大多主流开源大模型。

Chainbase 团队独创性地构建了首个专业 Web3 数据集,收录了 CoinMARKetCap 前 2000 项目的各类资料。数据集经过手动和算法过滤,确保训练数据的准确性、多样性和专业性。基于此数据集,团队采用 LoRA 技术高效微调模型,并利用 DEEPSpeed 等工具加速训练过程。此外,模型量化为 Q8 GGUF 格式,大幅降低了内存占用,提升了推理速度。

据悉,Theia-LLAma-3.1-8B 是 Chainbase 在加密领域大模型的初步尝试且该模型已成功应用于 Chainbase DEMO 交互应用 TheiaChat,目前日活用户超过 30 万。

声明:文章不代表神经日报观点及立场,不构成本平台任何投资建议。投资决策需建立在独立思考之上,本文内容仅供参考,风险自担!当前页面地址:https://www.nervedaily.com/kuaixun/41538.html
回顶部