华佗 GPT-II 医疗大模型

2024-3-3

HuatuoGPT（华佗GPT）是由香港中文大学（深圳）和深圳市大数据研究院的王本友教授团队发布的AI医疗大模型。

HuatuoGPT是一个基于广泛的中文医学语料库训练的大型语言模型（LLM），旨在通过HuatuoGPT为医疗咨询场景构建更专业的“ChatGPT”。

HuatuoGPT 使用了四种不同的数据集，分别如下：
蒸馏 ChatGPT 指令数据集（Distilled Instructions from ChatGPT）：这个数据集受到 Alpaca 模型创建指令集的方法启发，从 ChatGPT 中提炼出医疗相关的指令。与之前工作不同的是，本方法还加入了科室和角色信息，根据采样的科室或角色生成符合条件的指令数据集。
真实医生指令数据集（Real-world Instructions from Doctors）：这个数据集来源于真实医生和患者之间的问答。医生的回复通常简洁且口语化，因此本方法通过润色以提高其可读性。
蒸馏 ChatGPT 对话数据集（Distilled Conversations from ChatGPT）：这个数据集通过为两个 ChatGPT 模型提供共享的对话背景，让它们分别模仿医生和患者进行对话。
真实医生对话数据集（Real-world Conversations with Doctors）：这个数据集来源于真实医生的对话，但对医生的回复使用模型进行了润色。
这些数据集共同为模型提供了一个统一的语言模式、医生的诊断能力以及指令跟随能力。

体验网址：https://www.huatuogpt.cn

项目地址：https://github.com/FreedomIntelligence/HuatuoGPT-II

模型下载：
https://huggingface.co/FreedomIntelligence/HuatuoGPT2-7B
https://huggingface.co/FreedomIntelligence/HuatuoGPT2-13B

论文地址：https://arxiv.org/pdf/2305.15075.pdf

本文采用署名-非商业性使用-相同方式共享 4.0 国际许可协议[CC BY-NC-SA]进行授权 | 作者：CodeF
文章固定链接：https://www.codef.cc/huatuogpt-ii.html
本站资源仅供个人学习交流，请于下载后 24 小时内删除，不允许用于商业用途，否则法律问题自行承担。
本站软件默认解压密码均为：CodeF.cc

THE END

扣子 Coze

<<上一篇

Microsoft 开源课程 AI for Beginners

下一篇>>