开源模型家族,涵盖通用、推理和多模态理解。
基础预训练模型,适合定制化微调。基于增强型Mistral架构,使用2万亿+token训练。
指令遵循和对话AI助手。使用Tülu 3框架,通过SFT和DPO微调。
数学、逻辑和编码的高级推理模型。通过GRPO强化学习增强。
多模态理解的视觉语言模型。结合Moxin-7B-Base与DINOv2和SigLIP编码器。
模型、代码和数据均可在Hugging Face和GitHub获取。