站内搜索
AI模型工具
AI模型工具

通义千问是由阿里云推出的一种超大规模语言模型,它可以理解和回答各种领域的问题,包括常见、复杂甚至是少见的问题。它不仅是一个效率助手,也是一个点子生成机,可以帮助用户完成各种任务,如写邮件、写文章.写脚本、写情书、写诗等。此外,它还能提供娱乐功能,比如讲笑话、唱歌等。 详细介绍: 1.功能方面:通义千问具备多轮对话、文案创作、逻辑推理、多模态理解和多语言支持等功能。它能与人类进行多轮交互,融入了多模态的知识理解,并具有文案创作能力,可以续写小说、编写邮件等 2.技术特点:作为一个不断进化的AI大模型,通义千问基于通义大模型设计,能理解人类语言并生成内容。这使得它成为人们生活和工作的智能助手。 3.性能与发展:通义千问的综合性能已经超过GPT-3.5,并正在加速追赶GPT-4。通义千问2.0在指令遵循、工具使用、精细化创作等方面作了技术优化,能够更好地被下游应用场景集成。此外,通义大模型官网上线了多模态和插件功能。

智谱清言是一款基于人工智能技术的对话助手,遵循中国政府的立场和社会主义价值观,提供多领域知识问答信息检索、文本生成等服务。 详细介绍: 1.功能与应用:智谱清言能够理解和回答各种领域的问题,,包括常见知识、复杂问题以及少见话题。它旨在为用户提供准确、可靠的信息,同时传播积极、正面的价值观。 2.技术创新:智谱清言基于大型语言模型,经过专门训练,能够理解和生成中文文本。它还具备持续学习和自我更新的能力,以提供最新、最准确的信息。 3.使用体验:智谱清言的操作简便,用户可以通过输入问题来获取答案。它还支持多种形式的内容呈现,如文字、图片等,以满足不同用户的需求。 4.目标用户:智谱清言主要面向广大中文用户,特别是需要获取多领域知识、信息检索和文本生成的用户。它旨在为用户提供一个智能、便捷的问答平台,同时传播积极、正面的价值观。

“封神榜“中文最大的开源预训练模型体系,目前已有超过98个开源预训练模型。目前已经开源了第一个中文Stable Diffusion,开源了中文第一个CLIP模型,二郎神UniMC等模型多次获得FewCLUE/ZeroCLUE等榜单冠军。将数据和算力沉淀成具有认知能力的预训练模型,目标是成为海量下游任务和各种算法创新研究的坚实基础 “封神榜”是由粤港澳大湾区数字经济研究院(international Digital EconomyAcademy,简称IDEA研究院)认知计算与自然语言中心的工程师、研究人员、实习生团队共同维护的一项长期开源计划。“封神榜“开源体系将会重新审视整个中文预训练大模型开源社区,全方位的推进整个中文大模型社区的发展,旨在成为中文认知智能的基础设施。

MiniMax开放平台是国内领先的拥有文本、语音、视觉三模态融合的千亿参数语言大模型。这个平台由创业公司MiniMax构建,致力于通过搭建超大规模实验平台与推理平台,实现技术与产品的迭代闭环,从而在模型能力和用户交互量上实现极速增长。 平台详细介绍: 1.技术创新:MiniMax开放平台拥有万卡级别的跨云高效计算系统,支持单日过亿次级的调用。这使得平台能够提供高性能的AI技术服务,特别是在文本、语音、视觉三模态融合方面表现出色。 2.服务内容:该平台提供多种语音技术服务,包括语音合成、语音克隆、有声内容创作等。用户可以通过文档中心了解各项服务的介绍和使用方法,也可以通过体验中心在线试用各种语音效果。 3.企业级解决方案:MiniMax开放平台为大模型应用提供企业级解决方案,为企业和开发者提供功能丰富、高易用性的API。这些API旨在降低使用者的开发复杂性,帮助快速在目标场景中验证价值并生产部署。 4.目标用户:MiniMax开放平台的目标用户包括需要使用高级A!技术服务的企业和开发者,特别是那些对文本.语音、视觉三模态融合技术有需求的用户。总的来说,MiniMax开放平台是一个技术先进、服务全面、针对企业级用户的AI技术服务平台。 企业介绍 MiniMax-领先的AI大模型企业 MiniMax是一家成立于2021年11月的创业公司,专注于开发中文大语言模型。公司由商汤科技前副总裁闫俊杰创立,团队主要成员来自商汤科技等知名人工智能公司。MiniMax的技术特色在于其拥有文本到视觉(text tovisual)、文本到语音(text to audio)、文本到文本(text to text)三大模态的基础模型架构。 企业详细介绍: 1.技术创新:MiniMax开发了Glow,这是其第一个产品,仅用四个月时间就汇集了近五百万用户。公司还构建了ABAB大模型,这一模型在多种应用场景中表现出优越性能。 2.功能特点:MiniMax开放平台提供多种语音技术服务,如语音合成、语音克隆、有声内容创作等。该平台通过文档中心和体验中心为用户提供各项服务的介绍和使用方法。 3.企业定位:作为国内领先的拥有文本、语音、视觉三模态融合的千亿参数语言大模型,MiniMax致力于打通产品全链路。公司通过搭建超大规模实验平台与推理平台,实现了技术与产品的迭代闭环,从而在模型能力和用户交互量上实现极速增长。 4.目标用户:MiniMax的目标用户包括需要使用文本到视觉、文本到语音、文本到文本处理技术的各种企业和个人用户。其先进的技术和广泛的应用场景使其成为AI技术领域的受欢迎企业。

曹植大语言模型是国内首个垂直行业专用的自主可控的国产GPT大语言模型,由达观数据研发。这个模型可以准确完成多类型、复杂结构的长文本写作 ,并自动起草多种类型的文档。未来,曹植大语言模型还将实现多模态内容生成,例如长文档中的表格、图表、图片等。 详细介绍: 1.技术创新:曹植大语言模型基于GPT语言大模型,结合了达观数据长期的NLP实践和海量数据积累。:这款模型在长文本处理方面深耕多年,特别擅长长文档的写作、审核、润色、翻译等。 2.使用体验:曹植大语言模型的灵感来自中国历史上的曹植,以他七步成诗的典故闻名。这款模型具备长文本.多语言、垂直化三大特点,能够满足不同行业领域的需求。 3.功能与应用:作为一个垂直、专用、国产的大模型,曹植大语言模型主要用于长文本的自动化写作和多语种翻译。它能够支持多种语言长文本的自动化写作,为不同行业提供智能写作产品级应用,如金融、政务、制造等行业 4.目标用户:曹植大语言模型的主要用户群体包括需要进行长文本处理和多语种翻译的企业和专业人士。它特别适合那些希望在文档自动化写作和翻译方面提高效率和质量的用户

360智脑是360公司自研的认知型通用大模型,依托于360多年积累的大算力、大数据、工程化等关键优势,集成了360GPT大模型、360CV大模型、360多模态大模型技术能力。它具备生成创作、多轮对话、逻辑推理等十大核心能力和数百项细分功能,旨在重塑人机协作的新范式。 详细介绍: 1.技术创新:360智脑是一个规模庞大的AI大语言模型,参数达到干亿级别,具备跨模态生成的能力。它能够处理各种形式的数据,包括文字、图像、语音和视频等,从而在文本生成、图像生成以及文本到视频的转换等多方面发挥作用。 2.使用体验:360智脑作为一个新一代的智脑大模型驱动的数字人,能够帮助用户査找资料、分析总结、答疑解惑,并与用户伴读交流,共同成长。它被视为用户在知识学习和决策方面的良好助手。 3.功能与应用:360智脑不仅是个人用户的学习和决策工具,也是企业级的智能决策支持系统。它基于大数据和人工智能技术,能够帮助企业实现数据的实时分析和决策,提高决策效率和准确性,降低决策风险。 4.目标用户:360智脑主要面向需要进行复杂数据处理和决策的企业用户,同时也为个人用户提供知识学习和决策支持。它的应用场景广泛,包括教育、金融、医疗等多个行业。
A1视觉大模型
AI语言大模型

VALL-E一种用于文本到语音合成 (TTS)的语言建模方法。具体来说,我们使用从现成的神经音频编解码器模型派生的离散代码来训练神经编解码器语言模型(称为 VALL-E),并将 TTS 视为条件语言建模任务,而不是像以前的工作那样连续信号回归。在预训练阶段,我们将 TTS 训练数据扩展到 60K 小时的英语语音,这是现有系统的数百倍。VALL-E 出现了上下文学习能力,可用于合成高质量的个性化语音,只需录制3秒的未见过的说话者的注册录音作为声音提示。实验结果表明,VALL-E在语音自然度和说话人相似度方面明显优于最先进的零样本TTS 系统。此外,我们发现 VALL-E 可以在合成中保留说话者的情绪和声音提示的听觉环境.。
AI多模态大模型

紫东太初多模态大模型 “紫东太初“跨模态通用人工智能平台是由中国科学院自动化研究所研发的以多模态大模型为核心、基于全栈国产化基础软硬件平台,可支撑全场景AI应用。依托面向超大规模的高效分布式训练框架,自动化所构建了具有业界领先性能的中文预训练模型、语音预训练模型、视觉预训练模型,并开拓性地通过跨模态语义关联实现了视觉文本-语音三模态统一表示,构建了三模态预训练大模型,赋予跨模态通用人工智能平台多种核心能力。 "紫东太初“兼具跨模态理解和生成能力,具有了在无监督情况下多任务联合学习、并快速迁移到不同领域数据的强大能力。对更广泛、更多样的下游任务提供模型基础支撑,达成A!在如视频配音、语音播报、标题摘要、海报创作等更多元场景的应用。 中文预训练模型 文本预训练模型使用条件语言模型作为自监督目标进行训练,和GPT一样,模型根据上文来预测当前词汇,最终训练得到的模型可以生成流畅的中文表达, 本次开源的中文文本预训练模型由40层Transformer组成,隐层维度2560,包含32个注意力头,共32亿参数。训练语料丰富多样,包括新闻、百科、散文等,文本生成能力强大。 中文预训练模型基础上还可以进行微调操作,充分利用少量有监督数据增强模型在下游任务上的表现,如文本分类,对话生成、古诗创作等;除此之外,中文预训练模型还能够实现简单的少样本学习,如下图所示,输入已知的部分样例,模型能够捕捉类似的规律进行文本生成。
AI教育大模型
AI医学大模型
AI法律大模型

ChatGPT浪潮下,人工智能的不断扩展和发展为LLM的扩散提供了肥沃的土壤,目前医疗、教育、金融领域已逐渐有了各自的模型,但法律领域迟迟没有明显进展。 为了促进LLM在法律甚至其他垂直应用落地的开放研究,本项目开源了中文法律大模型,并针对LLM和知识库的结合问题给出了法律场景下合理的解决方案。 ChatLaw法律大模型目前开源的仅供学术参考的版本底座为姜子牙-13B、Anima-33B,我们使用大量法律新闻.法律论坛、法条、司法解释、法律咨询、法考题、判决文书等原始文本来构造对话数据。 基于姜子牙-13B的模型是第一版模型,得益于姜子牙的优秀中文能力和我们对数据清洗、数据增强过程的严格要求,我们在逻辑简单的法律任务上表现优异,但涉及到复杂逻辑的法律推理任务时往往表现不佳。 随后基于Anima-33B8 ,我们增加了训练数据,做成了ChatLaw-33B,发现逻辑推理能力大幅提升,由此可见大参数的中文LLM是至关重要的。 我们的技术报告在这里: arXiv: ChatLawg 基于可商用的模型训练而成的版本会作为我们后续产品内部接入的版本,对外不开源,可以在这里? 进行开源版本模型的试用
AI行业大模型

虽然LLaMA模型在通用领域通过指令微调已经展示出了令人印象深刻的性能,但对于自媒体创作、直播和运营等领域,由于缺乏专业的训练数据,其能力仍有待提高。为了解决这个问题,我们提出了MediaGPT,一个针对自媒体领域进行特殊训练的模型。 MediaGPT(曾用名Media LLaMA)首先在大规模自媒体语料上进行连续预训练,系统地学习自媒体的知识体系。然后,我们借助ChatGPT收集了一批关于抖音运营、短视频创作、巨量干川投放、直播运营和直播话术技巧等领域知识问题的分析和回答,并利用这些数据对模型进行指令微调,使模型习得如何将自媒体知识应用到实际场景中。 我们的模型具有以下能力: 掌握自媒体知识: 能够理解抖音运营、短视频创作、巨量千川投放、直播运营等领域的核心概念和策略。 适用于实际操作:能够以通俗易懂的语言解释自媒体概念,并进行基础的自媒体运营咨询,涵盖内容创作、平台运营、广告投放等领域。 为了推动中文自媒体大模型的开放研究,我们将开源一系列自媒体领域的指令微调数据和基于LLaMA训练的中文自媒体大模型的参数。

K2是一个地球科学的开源大预言模型。首先通过收集和清理的地球科学文献(包括地球科学开放获取论文@ 和维基百科页面)对 LLaMA 进行进一步预训练,然后使用知识密集型指令调优数据(GeoSignal)。 初步评估采用GeoBenchmark(由NPEE和AP Test on Geology、Geography、Environmental Science组成)作为基准。与具有相似参数的几个基线模型相比,K2在客观和主观任务上的表现优于基线。 我们介绍 K2 (7B),它是一个开源语言模型,首先在收集和清理过的地球科学文献(包括地球科学开放存取论文和维基百科页面)上对 LLaMA 进行进一步预训练,然后使用知识密集型指令调整数据(GeoSignal)进行微调在初步评估中,我们使用 GeoBench(由 NPEE 和关于地质学、地理学和环境科学的 AP 测试组成)作为基准。与参数相似的几个基准模型相比,K2 在客观和主观任务上的表现都优于基准模型。在该资源库中,我们将共享以下代码和数据。

7月19日,2023首届“阅文创作大会”在成都召开。发布会上,阅文公布全新升级后的多项创作扶持举措。国内网络文学行业首个大模型“阅文妙笔”和基于这一大模型的应用产品”作家助手妙笔版”在现场发布。 据介绍,"“作家助手妙笔版"即将正式开放内测,今年下半年还将基于大模型能力的迭代逐步开发各种新功能。系列举措将为作家打造包括作家服务、数据运营、技术工具等在内的网文创作“新基建”,依托平台和技术赋能持续帮助作家创作好作品。 "这是国内第一个网文大模型,也将是最懂网文、最懂作家的大模型。"阅文集团首席执行官兼总裁侯晓楠表示,“阅文妙笔的落地,是阅文拥抱AIGC,推动IP产业新变革的第一步。以妙笔为起点,未来我们还将向开放的、多模态的大模型持续升级,以AIGC全面赋能创作生态和IP生态。
AI海外大模型

xAI Grok一款用于理解宇宙的对话式AI,马斯克在 X平台上高调表示,[Grok 在很多重要方面,都是目前最好的 AI机器人。」 的确,在某些方面,Grok是「遥遥领先」的,比如它可以快速响应、支持多任务处理,还可以同时运行多个对好话 除了超强的「业务能力」,Grok 还「传承」了老板的「人格魅力」 和马斯克一样,Grok 既「机智」又「叛逆」,回复问题时,总是充满了「讽刺幽默感」 它就像你身边那个嘴贱的「学霸」的朋友,几乎可以回答任何问题,甚至会向你建议要问什么问题,而且对「敏感尖锐」的问题也毫不避讳,可以说是颠覆了传统 A! 助手的形象,甚至让人心生疑问:回答问题的是不是马斯克本人? 不得不提的是,Grok 背后的公司,xAI在今年7月才成立,团队算马斯克一共也只有 12 个人,但却用了不过四个月,就交出了第一个「作品」。这效率,放眼业内也是相当「炸裂」的存在。 目前,Grok 还处于早期测试阶段,只对少量美国用户开放测试,想要参与的用户也可以通过 xAI 官网进行申请,但不久的将来,X平台所有的「高级订阅用户」(XPremium+)都可以使用 Grok。