开源大模型图片识别
识别细胞也能用大模型了!清华系团队出品,已入选ICML 2024 | 开源水木分子投稿量子位| 公众号QbitAI大模型带来的生命科学领域突破,刚刚再传新进展。来自清华系,使用大模型实现了单细胞身份识别,同时模型LangCell也正式对外开源。它不仅可以准确识别细胞身份,还具有很强的零样本分析能力,论文已被ICML 2024录⽤。LangCell的数据集中包含约后面会介绍。
阿里云通义千问开源语音基座模型,识别效果优于OpenAI WhisperIT之家7 月9 日消息,阿里云通义千问开源了两款语音基座模型SenseVoice(用于语音识别)和CosyVoice(用于语音生成)。SenseVoice 专注于高精度多语言语音识别、情感辨识和音频事件检测,有以下特点:多语言识别:采用超过40 万小时数据训练,支持超过50 种语言,识别效果上优于W说完了。
摩尔线程正式开源音频理解大模型MooER鞭牛士8月24日消息,摩尔线程昨日宣布开源音频理解大模型—MooER(摩耳)。据摩尔线程方面介绍,MooER是业界首个基于国产全功能GPU进行训练和推理的大型开源语音模型,不仅支持中文和英文的语音识别,还具备中译英的语音翻译能力。
ˋ0ˊ
阿里7B多模态文档理解大模型拿下新SOTA|开源开源了一系列文档理解大模型和训练数据。本文从最新工作mPLUG-DocOwl 1.5出发,剖析“多模态文档理解”领域的关键挑战和有效解决方案。挑战一:高分辨率图片文字识别区分于一般图片,文档图片的特点在于形状大小多样化,其可以包括A4大小的文档图、短而宽的表格图、长而窄等会说。
硅谷VC张璐:硅谷大模型市场分为三类,三大应用领域迭代速度较快在中国AIGC产业峰会上给出了这些关键判断:现阶段,初创企业基本上都可以做“鸡尾酒”模式,即调动最前沿大模型的API,在上面配套使用开源模型,再自己做些修改进行模型调优。在硅谷,模型的市场已经比较相对明确,主要有三类,我个人非常看好开源平台。人工智能是超级工具,我们的说完了。
阿里云通义SenseVoice与CosyVoice两款语音基座模型正式开源近日,阿里云通义宣布正式开源两款前沿的语音基座模型SenseVoice与CosyVoice,这两款模型分别针对语音识别与语音生成领域,以其卓越的性能和广泛的应用潜力见长,其中SenseVoice在语音识别方面的表现尤为突出,其识别效果已超越行业标杆OpenAI Whisper。SenseVoice作为一款好了吧!
∩0∩
小米大模型提效新框架:训练最高提速34%,推理最高提速52%!小米AI实验室投稿量子位| 公众号QbitAI大模型推理速度提升50%以上,还能保证少样本学习性能!小米大模型团队提出SUBLLM(Subsampling-Upsampling-Bypass Large Language Model),国际AI语音大牛、开源语音识别工具Kaldi之父Daniel Povey也参与指导。与Llama等模型相比,SUB等会说。
GLM-4-9B来了,智谱AI给小模型注入了大能量国产大模型选手智谱AI,近日又有了新动作。官方最新消息,第四代GLM系列开源模型GLM-4-9B正式推出。首先有必要简单解释下,在谈及大模型的概念时,会通过参数指标来进行区分。参数在10B(100亿)以下的,通常会被归类为小模型。因此,智谱AI现在发布的GLM-4-9B,也可以被归类到小说完了。
∪△∪
AI机器人核心:机器视觉龙头归来MetaAI在官网发布了基础模型SAM并开源,SAM模型建立了一个基于海量数据训练而获得泛化能力的图像分割大模型。 图像分割是有助于识别和确认图像中的不同物体,把它们从背景中分离出来,在自动驾驶、医学成像等领域特别重要。 二.机器视觉概览 机器视觉是通过光学装置还有呢?
>△<
●▽●
中电万维申请文本通用程度评分方法专利,创新评估文本通用程度本发明公开一种基于大语言模型token 的文本通用程度评分方法。开源tokens 收集汇总的方式,旨在充分利用现有大模型训练的通用tokens,形成一种判断文本通用程度的计算方法,本专利的创新点主要体现在设计了一种业界尚未实现的技术思路来评估文本通用程度。本专利通过当前业后面会介绍。
˙▽˙
原创文章,作者:上海傲慕捷网络科技有限公司,如若转载,请注明出处:http://geyewr.cn/o9vbi936.html