2024-04-11 12:49

人工智能初创公司Mistral推出了一款281GB的人工智能模型,与OpenAI、Meta和谷歌竞争

法国人工智能初创公司Mistral周二发布了一款新的大型语言模型(LLM) Mixtral 8x22B,这是该公司在人工智能领域与大公司竞争的最新尝试。据Gigazine报道,预计Mixtral 8x22B的性能将超过Mistral之前的Mixtral 8x7B LLM,后者本身就显示出超过OpenAI的ggt -3.5和meta的Llama 2的迹象。

新的Mixtral模型拥有6.5万个令牌上下文窗口,这是指人工智能模型一次可以处理和引用的文本数量。此外,Mixtral 8x22B的参数大小高达1760亿,这是模型用于做出决策或预测的内部变量数量的参考。

Mistral由谷歌和meta的研究人员创立,对其人工智能模型采用开源方法。在这种情况下,任何人都可以在下载281GB的文件后使用Mixtral 8x22B。要自己这样做,只需将Mistral AI的X帖子中的磁铁链接粘贴到您最喜欢的BitTorrent客户端。

Mistral最新LLM的发布正值人工智能行业出现新的创新模型的繁忙时期。

本周二,OpenAI发布了GPT-4 Turbo with Vision,这是最新的GPT-4 Turbo模型,具有视觉功能,可以处理用户上传的照片、图纸和其他图像。同一天,谷歌向开发者发布了其先进的Gemini Pro 1.5 LLM,并提供了一个免费选项,每天最多可授予50个请求。不甘示弱,meta透露其羊驼3模型将于本月晚些时候亮相。

Mixtral 8x22B和其他高级llm被称为前沿模型,它们可以处理各种各样的任务和请求。唤起狂野的西部,他们的目标是超越以前的模型与更先进的技术。frontier这个词也会让人联想到一种危机感。在2023年7月的一篇博文中,OpenAI描述了前沿模型的风险。

“前沿人工智能模型带来了明显的监管挑战:危险的能力可能会意外出现;很难健壮地防止已部署模型被滥用;而且,很难阻止模型的能力广泛扩散,”OpenAI写道。“行业自律是重要的第一步。然而,需要更广泛的社会讨论和政府干预来制定标准,并确保这些标准得到遵守。”

据《卫报》报道,Mistral的开源方法也招致了一些批评。通过允许任何人下载和构建其人工智能模型,这家初创公司无法阻止其系统被用于有害目的。此外,如果出现某些需要解决的缺陷或偏见,这些模型也不能下线。

相关推荐