起因
想自己找个模型,实现简单的对话。如果能自己train的话是最好的。
写的不会很多,可能大多只是简单介绍下。
正文
文本
-
GPT-J-6B
也许是没有加入RLHF(Reinforcement Learning from Human Feedback,人类反馈强化学习)的缘故,回答很奇怪。
-
chatGLM-6B
有RLHF,回答也比较讨巧。但是开放的版本仅限于中文回答。
图像
SD1.4
高度依赖prompt,需要非常精细的调整。
想自己找个模型,实现简单的对话。如果能自己train的话是最好的。
写的不会很多,可能大多只是简单介绍下。
GPT-J-6B
也许是没有加入RLHF(Reinforcement Learning from Human Feedback,人类反馈强化学习)的缘故,回答很奇怪。
chatGLM-6B
有RLHF,回答也比较讨巧。但是开放的版本仅限于中文回答。
高度依赖prompt,需要非常精细的调整。
留言