开源日报 | 中式SaaS焦虑;一个AI从业者的十年;GPT-4o现货变期货;GitLab将被“卖身”;人工智能是福是祸?
欢迎阅读 OSCHINA 编辑部出品的开源日报——您探索和理解开源世界的日常指南。在这里,我们每天从宏观到微观,全面展现开源技术和文化的动态图景。
每日一更,风雨无阻。
OpenSource Daily # 2024.7.17省流概览
-GitLab 正在考虑出售
-Mistral AI 发布两款开源大模型
-OpenJDK 计划要求限制 JNI 的使用
-一个 AI 从业者的十年
-中式 SaaS 焦虑:卷完大模型,卷向海外,有戏?
-GPT-4o 现货变期货,是什么在拖 OpenAI 的后腿
-人工智能,是福是祸?
今日要闻
GitLab 正在考虑出售
根据路透社的独家报道,美国云软件开发工具供应商 GitLab 正在考虑出售,该公司目前市值约 80 亿美元(约 582.43 亿元人民币),投资者包括谷歌母公司 Alphabet。消息人士称,GitLab 正在与投资银行家合作启动出售流程,该流程吸引了包括云监控公司 Datadog 在内的同行的兴趣。
Datadog 是一家 SaaS 公司,提供服务器、数据库等的监控服务,当前市值达 440 亿美元(约 3203.38 亿元人民币)。
据熟悉内情的消息人士透露,距离 GitLab 达成出售协议仍需数周时间,不过目前还不确定是否能达成协议。由于此事属于机密,因此消息人士要求匿名。
路透社表示,GitLab 和 Datadog 没有回应置评请求。Alphabet 通过其风险投资部门持有 GitLab 22.2% 的投票权,该公司也没有回应置评请求。
Mistral AI 发布开源代码大模型 Codestral Mamba、数学大模型 Mathstral
法国人工智能初创公司 Mistral 在其不断壮大的大型语言模型 (LLM) 家族中推出了两个新产品:一个是基于数学的模型,另一个是面向程序员和开发人员的代码生成模型,其基础是去年底由其他研究人员开发的名为 Mamba 的新架构。
Codestral Mamba:
/
展开全文
Mathstral:
/
Mamba 试图通过简化注意力机制来提高大多数领先 LLM 所使用的 Transformer 架构的效率。与更常见的基于 Transformer 的模型不同,基于 Mamba 的模型推理时间更快,上下文时间更长。
Mistral 的 Codestral Mamba 7B 采用了这种新架构,即使输入文本较长,也能提供快速的响应时间。
Mistral 推出的第二个模型是 Mathstral 7B,这是一个专为数学推理和科学发现而设计的人工智能模型。Mistral 与 Numina 项目共同开发了 Mathstral。
OpenJDK 计划要求限制 JNI 的使用
Java 社区正在推进一项名为 “JEP 472:Prepare to Restrict the Use of JNI(准备限制 JNI 使用)” 的提案,旨在保留 Java Native Interface (JNI) 作为与本地代码互操作的标准方式的状态。
JNI 在 JDK 1.1(可追溯到 1997 年 2 月)中被引入,作为 Java 代码与本地代码(通常用 C 语言编写)之间互操作的主要手段,允许 Java 代码调用本地代码(向下调用)和本地代码调用 Java 代码(向上调用)。
但提案指出,Java 代码和本地代码之间的任何交互都存在风险,它可能会损害应用程序和 Java 平台本身的完整性。根据默认完整性策略,所有能够破坏完整性的 JDK 功能都必须获得应用程序开发人员的明确批准。
Anthropic 推出 Claude Android 应用
Android 版 Claude 工作方式与 5 月份发布的 iOS 版本相同,包括免费访问 Anthropic 的最佳 AI 模型 Claude 3.5 Sonnet,以及通过 Anthropic 的 Pro 和 Team 订阅升级计划。用户将能够跨设备同步与 Claude 的对话,并将照片或文件上传到应用程序进行实时图像分析。
Claude Android 应用程序还包括实时语言翻译,以及允许企业客户通过手机访问他们的 Claude 帐户。
今日观察社交观察
让 Python 命令行程序有层次的组装
Python 代码非常容易写成一堆散乱的脚本。语言过于自由,以至于大部分人写出来的代码毫无结构化很快就难以维护。该项目让 Python 命令行程序有层次的组装,同时提供层次结构的命令行调用。现在我又简单的升级了下,初步让它支持 async,同时支持了任意节点的执行,节点下的树会被递归并发执行。
直接看例子:
github.com/fanfeilong/pyouter/blob/main/src/tests/test.py
- 微博幻灰龙
OpenAI 创始人之一 Andrej Karpathy 成立 Eureka Labs
原来前 OpenAI 创始人之一 Andrej Karpathy 在离开 OpenAI 之后去做教育事业了,成立了 Eureka Labs,一种集成了 AI 的新型教学平台。第一门课会是 LLM101n。这是一门本科级别的课程,引导学生训练自己的 AI,非常类似于一个小型的 AI 教学助手。课程材料将在线提供,同时运行数字和实体的学习群。
他们的教学会引入 AI,老师设计课程材料,但会有 AI 助教,AI 助教可以帮助学生理解课程内容。当然这种老师与 AI 助教的协作的模式需要一种新型教学平台的支持,所以预计他们会先基于自己的课程来探索这种模式和完善平台,最终会推广他们探索出来的教学模式和平台。
- 微博宝玉xp
一个宝藏网站:OSS Gallery
网站风格简洁实用,汇集了大佬们提交的各种最佳开源项目,每个项目都添加了详细的统计信息。你可以通过这个网站发现许多有趣的开源项目。项目按 Stars 排名,你还可以看到当前最流行的项目趋势,感兴趣的小伙伴可以 Mark 一下。
/
- 微博张岱樾
一个 AI 从业者的十年
展望未来,我是非常乐观的。虽然当今世界并不太平,各种冲突矛盾不断,但 AI 对生产力的促进是确定的。有人担心 AI 会让很多人失业,但李飞飞认为,AI 取代的是任务,而不是工作。每项工作都由大量任务组成,让 AI 去完成繁重的任务,人类的创造力将进一步解放。20 年前,随着生产力的提高,大部分国家开始实行一周五天工作制。在下一轮 AI 工业革命到来之际,一周休三天,也不是遥不可及的幻想。
- 微博雪球
腾讯开源的大模型 BI 产品 SuperSonic(超音速)
集成语义建模层,比传统 NL2SQL 效果好很多,目前比较好的开源实现,适合大模型 BI 取数产品对比
- 微博tobe-迪豪
新版的 AutoGPT 开源了
关键功能之一是用了可视化节点编辑的形式,而且可以自定义添加节点 。
自定义节点的编写也比较简单,难道会成为 LLM 版本的 ComfyUI 吗?
/
- 微博歸藏的AI工具箱
媒体观察
中式 SaaS 焦虑:卷完大模型,卷向海外,有戏?
但客观事实是,在海外 SaaS 市场中,众多重量级企业竞争激烈,其中 Teams、Slack、Zoom 等老牌及新兴企业已经瓜分了市场的大部分份额。
巨头林立之下,对于钉钉等中国 SaaS “优等生” 言,即便拥有大厂实力的加持,要想在这个由行业巨头主导的海外市场中脱颖而出,仍需面对巨大的挑战,尤其是在本地化运营和海外品牌建设方面;市场接受度、法律法规等方面同样存在较大的不确定性。
-伯虎财经
抖快激战人工智能
而作为抖音和快手这种短视频龙头来说,将 AI 技术 “随风潜入夜,润物细无声” 实现落地,这可能他们想要达到的终极目的。
多位 AI 领域从业者向钛媒体 App 坦言,目前 AI 大模型技术更像是 “文科生”,很难理解数学问题,所以其应用场景的范围非常有限,当前模型的最大作用是提升效率的 “生产力工具”。
-钛媒体
GPT-4o 现货变期货,是什么在拖 OpenAI 的后腿
为什么发布会上,实时多模态大模型距离变革世界只有一步之遥;在真正走向产品化落地的过程中,却总是「现货」变「期权」?
一种新的声音正在浮出水面:在多模态的世界里,或许(算法)暴力无奇迹。
-极客公园
人工智能,是福是祸?
为人工智能建立一个全球治理机制听起来似乎有些天方夜谭,但困难并非完全不可克服。一方面,需要积极协调众多利益相关者,推动建立普遍参与的国际机制;另一方面,也不妨利用多中心秩序,鼓励地方政府和私营公司采取多层次行动,制定适合其具体情况的创新政策。
-中国新闻周刊
早半年发 arXiv,却被质疑抄袭:活在微软 AutoGen 阴影里的 CAMEL
作为后来者,AutoGen 确实在论文中提到过 CAMEL,并指出了 CAMEL 与 AutoGen 之间的一些差异。但这些内容出现的位置令人费解 —— 它们统统出现在附录中。这可能也是导致其他研究者只知 AutoGen,不知 CAMEL 的一大原因。毕竟,有几个人会去仔细看附录呢?
-机器之心
发力语料建设 让人工智能健康成长
在人工智能发展中,语料具有 “赋能” 和 “教化” 的双重功能,前者通过全方位的知识转移和训练,使得人工智能博闻强识,融会贯通,进而技艺超群;后者通过多维度的情感嵌入和价值对齐,让人工智能 “通情达理”,并且 “善解人意”。
-光明网
两大 AI 独角兽 “卖身” 被调查!
微软和亚马逊通过另辟蹊径策略挖走 AI 独角兽核心团队的做法,正收到监管机构的密切关注。
此外,上周微软放弃了在 OpenAI 担任董事的计划,这一决定被视为微软试图逃避日益严格的监管审查的一种方式。美国和欧洲的监管机构曾对微软对 OpenAI 的影响表示担忧。英国监管机构仍未决定是否对 OpenAI 的投资展开调查。
-智东西
今日推荐
开源项目
reloadware/reloadium
Reloadium 可以为任何 Python 应用程序添加热重载,也称为 “编辑并继续” 功能。
每日一博
前后端数据传输约定探讨
前后端数据传输约定旨在提升系统稳定性、可靠性,降低线上线下 bug 率;并提升研发效率、降低沟通成本、降低延期率。是确保项目前端和后端开发顺利进行的重要规约之一,定义了前端与后端交互的规则和标准。
开源之声
用户观点
什么赛博码农——脑机接口让脑出血 “码农” 重返岗位
观点 1:好可怜啊,写代码都写的脑出血了,还要拉回来继续写代码
观点 2:你负责替他养家糊口还房贷?人家能恢复正常机能就是好事,要不要换个工作是人家的自由,轮不到你阴阳怪气的。
观点 3:准备出院,握紧医生双手,第一句话,脑机接口给我文档,我要调优,三天后,一声大呼 “这接口有 bug”,猝
观点 4:这个 bug 可能就是发现 bug 自动宕机自毁吧。
观点 5:醒醒,你的砖还没搬完,怎么能躺下
观点 6:这,怕是回去修 bug 了……
观点 7:所以到底是要 AI 还是要牛马
观点 8:这很难评
观点 9:快进到赛博打工人,电子资本家。
观点 10:可以给自己的脑机接口写代码
观点 11:给我一个脑机接口吧,支持可编程就行,自己开发自己用
观点 12:兄弟你真勇啊,我自己开发的软件我都不用
观点 13:标题短短几个字,我感到自豪又辛酸…
观点 14:马斯克点了个 “赞”
观点 15:快进到机械姬
观点 16:IT 行业更卷了
观点 17:我是很反对脑机接口,不是很能接受。但是它也的确解决了一些问题。
观点 1:好可怜啊,写代码都写的脑出血了,还要拉回来继续写代码
观点 2:你负责替他养家糊口还房贷?人家能恢复正常机能就是好事,要不要换个工作是人家的自由,轮不到你阴阳怪气的。
观点 3:准备出院,握紧医生双手,第一句话,脑机接口给我文档,我要调优,三天后,一声大呼 “这接口有 bug”,猝
观点 4:这个 bug 可能就是发现 bug 自动宕机自毁吧。
观点 5:醒醒,你的砖还没搬完,怎么能躺下
观点 6:这,怕是回去修 bug 了……
观点 7:所以到底是要 AI 还是要牛马
观点 8:这很难评
观点 9:快进到赛博打工人,电子资本家。
观点 10:可以给自己的脑机接口写代码
观点 11:给我一个脑机接口吧,支持可编程就行,自己开发自己用
观点 12:兄弟你真勇啊,我自己开发的软件我都不用
观点 13:标题短短几个字,我感到自豪又辛酸…
观点 14:马斯克点了个 “赞”
观点 15:快进到机械姬
观点 16:IT 行业更卷了
观点 17:我是很反对脑机接口,不是很能接受。但是它也的确解决了一些问题。
观点 2:你负责替他养家糊口还房贷?人家能恢复正常机能就是好事,要不要换个工作是人家的自由,轮不到你阴阳怪气的。
观点 4:这个 bug 可能就是发现 bug 自动宕机自毁吧。
观点 12:兄弟你真勇啊,我自己开发的软件我都不用
观点 1:说得也在理,闭源有成熟的商业化,可靠性和专业度要高。开源和闭源并不冲突,闭源基于开源发展,把通用部分拿出来开源,利己利他。
观点 2:对模型有深刻理解的人是不会在开源闭源角度出发去谈论模型的好坏的,而是像 LeCun 那样从模型本质(如 auto regression 的错误积累)向大众解释模型在发展中会遇到的一些天花板 / 瓶颈。开源闭源只是一个公司在商业、技术战略角度的一个选择,而非黑白分明的 “好”/“坏”。再高尚以及长远的一点的出发角度,也许还有出于管控人工智能安全的考虑(当然闭源也不是说做不到)。现在这种混乱时期去下这种定论吧,难怪评论区都在笑
观点 3:开源和闭源又不能决定模型好坏。文心一言既不如闭源的 GPT,也不如开源的 Qwen,这你上哪说理去。
观点 4:但凡用过 ChatGPT 都知道哪个好用 自己吹的再厉害有啥用
观点 5:就是想垄断搞钱罢了
观点 6:李彦宏更像一个用技术语言在发声的愣头青,可能讲得很真实,很直接,但没有受众
观点 7:不,感觉是想打扮成技术发言但又穿了西装打领带拿着市场部写的稿,两边不讨好
观点 8:讲开源闭源的目的是啥?除了引来喷增加热度,有啥好处?
观点 9:追求效率的话 眼下确实如此 但从长远发展看 技术需要持续演进 而不是短期效率。我们有时候太重视效率 而不看重事物发展的本质。技术发展 慢就是快,众人参与 走的不快但一定更远
观点 10:没错,说云计算新瓶装旧酒的也是他。
观点 11:百度在开源领域搞的好好的,飞浆以前也挺好用,结果突然拥抱闭源。感觉百度又要起大早赶晚集
观点 12:你不想开源就别开源,国内确实没有开源文化
观点 13:openai 闭源,是因为人家大模型牛逼,其他的不行,就靠开源来发展,而你呢?不管闭源的还是开源的,你都打不过,说毛线啊
观点 14:他故意将经济优势跟技术优势混为一谈,闭源在商业上有优势、能长久,但不一定比开源的东西好。
观点 15:闭源就是黑箱
观点 1:说得也在理,闭源有成熟的商业化,可靠性和专业度要高。开源和闭源并不冲突,闭源基于开源发展,把通用部分拿出来开源,利己利他。
观点 2:对模型有深刻理解的人是不会在开源闭源角度出发去谈论模型的好坏的,而是像 LeCun 那样从模型本质(如 auto regression 的错误积累)向大众解释模型在发展中会遇到的一些天花板 / 瓶颈。开源闭源只是一个公司在商业、技术战略角度的一个选择,而非黑白分明的 “好”/“坏”。再高尚以及长远的一点的出发角度,也许还有出于管控人工智能安全的考虑(当然闭源也不是说做不到)。现在这种混乱时期去下这种定论吧,难怪评论区都在笑
观点 3:开源和闭源又不能决定模型好坏。文心一言既不如闭源的 GPT,也不如开源的 Qwen,这你上哪说理去。
观点 4:但凡用过 ChatGPT 都知道哪个好用 自己吹的再厉害有啥用
观点 5:就是想垄断搞钱罢了
观点 6:李彦宏更像一个用技术语言在发声的愣头青,可能讲得很真实,很直接,但没有受众
观点 7:不,感觉是想打扮成技术发言但又穿了西装打领带拿着市场部写的稿,两边不讨好
观点 8:讲开源闭源的目的是啥?除了引来喷增加热度,有啥好处?
观点 9:追求效率的话 眼下确实如此 但从长远发展看 技术需要持续演进 而不是短期效率。我们有时候太重视效率 而不看重事物发展的本质。技术发展 慢就是快,众人参与 走的不快但一定更远
观点 10:没错,说云计算新瓶装旧酒的也是他。
观点 11:百度在开源领域搞的好好的,飞浆以前也挺好用,结果突然拥抱闭源。感觉百度又要起大早赶晚集
观点 12:你不想开源就别开源,国内确实没有开源文化
观点 13:openai 闭源,是因为人家大模型牛逼,其他的不行,就靠开源来发展,而你呢?不管闭源的还是开源的,你都打不过,说毛线啊
观点 14:他故意将经济优势跟技术优势混为一谈,闭源在商业上有优势、能长久,但不一定比开源的东西好。
观点 15:闭源就是黑箱
观点 7:不,感觉是想打扮成技术发言但又穿了西装打领带拿着市场部写的稿,两边不讨好
观点 1:这个库太赞了
观点 2:看了下官网的珠串设计小程序案例,有点好玩哈哈啊哈,改天看能不能用在自己的小程序上面
观点 3:已经使用半年了,高性能易用,web 也能很轻松做出可视化应用了
观点 4:想问这个库是基于 canvas 2d context 吗?
观点 5:底层可以接不同的渲染方式,比如 webgpu,目前先接入的是 2d
观点 6:支持,期待下截取图片功能,想用
观点 7:这个真要支持,能看出来是在认真做事
观点 1:这个库太赞了
观点 2:看了下官网的珠串设计小程序案例,有点好玩哈哈啊哈,改天看能不能用在自己的小程序上面
观点 3:已经使用半年了,高性能易用,web 也能很轻松做出可视化应用了
观点 4:想问这个库是基于 canvas 2d context 吗?
观点 5:底层可以接不同的渲染方式,比如 webgpu,目前先接入的是 2d
观点 6:支持,期待下截取图片功能,想用
观点 7:这个真要支持,能看出来是在认真做事
观点 5:底层可以接不同的渲染方式,比如 webgpu,目前先接入的是 2d
程序员梗图
END
References
最后,欢迎扫码下载「开源中国 APP」
阅读海量技术报告、程序员极客分享
评论