chatglm-6b是清华大学知识工程和数据挖掘小组(knowledge engineering group (keg) & data mining at tsinghua university)发布的一个开源的对话机器人。根据官方介绍,这是一个千亿参数规模的中英文语言模型。并且对中文做了优化。本次开源的版本是其60亿参数的小规模版本,约60亿参数,本地部署仅需要6gb显存(int4量化级别)。
#科技之巅#
chatglm-6b模型卡信息:
chatglm-6b(chatglm-6b)详情 | 数据学习 (datalearner)
chatglm-6b的特点
从目前的使用情况看,这个模型虽然不大,但也是与chatgpt类似,做了针对对话的调优,使用体验很好。
下图是几个对话实例:
可以看到,虽然该模型并不是很大,但是回答的结果十分自然。在这种规模的模型上能做到这种程度,对于很多中小企业或者成本青春的个人开发者来说十分具有吸引力。
该模型的基础模型是glm( glm: general language model pretraining with autoregressive blank infilling ),是清华大学2023年2月份发布的一个预训练大模型。在2023年2月,他们发布了1300亿参数的超大规模的模型。该模型也是开源,只是目前仅接受内测邀请,需要申请才能使用。
chatglm-6b模型的硬件使用成本
根据测试,chatglm-6b虽然参数很少,但是效果很好。对于硬件的需求也很低。
硬件需求:
量化等级
最低gpu显存
fp16(无量化)
13gb
int8
10gb
int4
6gb
大家可以直接去官方下载预训练文件使用:
chatglm-6b(chatglm-6b)详情 | 数据学习 (datalearner)
2024-08-26
2024-08-26
2024-08-26
2024-08-26
2024-08-26
2024-08-26
2024-08-26
2024-08-26
2024-08-26
2024-08-26
金沙娱场城app copyright © 2024 金沙娱场城app-老版金沙app下载客户手机端 北京智识时代科技有限公司 金沙娱场城app的版权所有