支持更多模态、更强泛化能力 microsoft/florence-2 Microsoft开发的多模态理解和生成模型 复杂场景分类、细粒度分类 支持多模态理解和生成的大型视觉-语言模型 google/align