(资料图片)
编程客栈()5月22日 消息:最近,来自清华的一个叫VisualGLM-6B的大模型在网上热传。原因是有网友发现它似乎对表情包的解读有一手。无论是腊肠犬版蒙娜丽莎还是出租车后熨衣斗的编程客栈男子,它都能准确解读。
值得注意的是,虽然VisualGLM-6B连gif也能看懂,但目前测试的结果来看,它的解读都太多正经,带有文字的表情包它则无法解读出原本要传达的情绪。
目前,VisualGLM-6B已经推出了网页端的试玩版。用户只需要在Hugging Face的试玩界面上传图片,并与其进行“对话”,它就可以生成对图片的理解结果。
实际上,VisualGLM-6B并不是专门为“表情包解读编程客栈”而开发的。它由智谱AI和清华大学KEG实验室开发的开源多模态对话模型,主要用于中文图像理解。解读表情包只不过是该模型的“副业”之一。
VisualGLM-6B最大的特点在于结合模型量化技术,可以让用户在消费级的显卡上进行本地部署,在INT4量化级别下,最低只需要8.python7G显存。
VisualGLM-6B试玩地址:
https://hugg编程客栈ingface.co/spaces/lykeven/visualglm-6b