找回密码
 立即注册

QQ登录

只需一步,快速开始

查看: 33|回复: 0

一键识图!可以在任何地方运行的微型视觉语言模型!

[复制链接]

442

主题

26

回帖

40万

积分

管理员

积分
406463

最佳新人活跃会员热心会员推广达人宣传达人灌水之王突出贡献优秀版主荣誉管理论坛元老

发表于 2026-1-25 10:05:29 | 显示全部楼层 |阅读模式
一键识图!可以在任何地方运行的微型视觉语言模型!Moondream是一个免费开源的小型的人工智能视觉语言模型,该模型具有高性能的视觉处理能力,可以根据你的提问,识别并推测图片,给出答案。该模型由开发人员vikhyatk推出,使用SigLP、Phi-1.5和LLaVa训练数据集和模型权重初始化进行构建。
Moondream具有惊人的小体量,可在本地计算机甚至移动设备或 Raspberry Pi 上运行。
GitHub地址:
游客,如果您要查看本帖隐藏内容请回复





懒得打字嘛,点击右侧快捷回复 【回复可见】
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

手机版|小黑屋|共享世间美好--个人小众交流圈 ( 鲁ICP备17021911号-1 )

GMT+8, 2026-3-7 13:04 , Processed in 0.098293 second(s), 19 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表