这是个有意思的估算题。我直接基于公开信息和工程经验来推算,不需要动代码。
一、微信有多少行代码?
微信从来没公开过代码量,但可以从几个公开线索倒推:
已知公开线索
- 微信安装包(主程序)安卓端早年就超过 1.5GB 的解压体积,iOS 端二进制 200MB+。
- 张小龙团队 2019 公开过:微信"展示一张图片"的代码路径牵涉极其庞大的兼容逻辑。
- 微信是个超级 App:即时通讯、朋友圈、公众号、小程序运行时(等于内置了一个浏览器/JS 引擎)、微信支付、视频号(短视频+直播+推荐)、企业微信打通、音视频通话(自研引擎)、跨平台四端(iOS/Android/Win/Mac/Linux/Web)。
分模块粗估(仅客户端 + 核心后端,不含基础设施)
| 模块 | 量级(行) |
|---|---|
| 客户端四端 UI + 业务逻辑 | 2000 万 ~ 3000 万 |
| 小程序运行时/引擎 | 300 万 ~ 500 万 |
| 音视频引擎(自研) | 100 万 ~ 200 万 |
| 后端 IM/消息系统(海量长连接) | 500 万 ~ 1000 万 |
| 支付系统(含风控、清结算) | 500 万+ |
| 视频号(推荐/转码/直播/CDN) | 500 万+ |
| 公众号/开放平台/小程序后台 | 数百万 |
合理区间:整个微信生态约 5000 万 ~ 1 亿行代码。 取一个中位数 约 7000 万行 来算。
参考系:Windows 操作系统约 5000 万行,Google 全公司单仓约 20 亿行。微信作为承载十几亿用户、横跨支付/社交/内容的超级平台,7000 万行是合理量级。
二、用 AI 重写一套完整微信要多少 token?
这里要把"生成代码"和"真正开发出来"分清楚,差别是几个数量级。
口径 A:只算"把这些代码打印出来"的理论下限
代码的 token 密度大约 1 行 ≈ 8~12 token(含缩进、符号、变量名)。取 10。
7000 万行 × 10 token/行 ≈ 7 亿 token(纯输出下限)
但这个数字毫无意义——它假设 AI 一次成型、零思考、零返工、零上下文。
口径 B:真实 AI 工程化开发的消耗
实际用 Claude/Agent 这类工具写代码,token 消耗主要不在"输出代码",而在:
- 输入侧(读上下文):每写一段新代码,要把相关文件、接口、规范读进上下文。真实项目里 输入 token 通常是输出的 5~20 倍。
- 思考/推理:架构设计、调试、改 bug。
- 返工:一段功能平均要改 3~10 遍才正确。
经验系数:「最终留存的 1 行代码,全过程平均烧掉 500 ~ 2000 token」(涵盖读上下文、思考、试错、重写、测试)。这个比例在大型 agentic 编码实践里是相对靠谱的量级。
取中位 1000 token/最终行:
7000 万行 × 1000 token/行 ≈ 700 亿 token
考虑到微信的复杂度(分布式、超大规模、风控、合规、四端适配),实际更可能偏向上限:
综合估算:约 500 亿 ~ 2000 亿 token,中位数 ~1000 亿 token。
三、换算成成本和时间感
按 Opus 4.8 的价格量级(输入 ~$5/百万、输出 ~$25/百万 token,混合按 ~$10/百万 估):
- 1000 亿 token × $10/百万 ≈ 100 万美元 纯模型 API 费用(口径 B 中位)。
- 区间约 50 万 ~ 200 万美元。
这还仅仅是 token 账单,不含:
- 产品设计、需求迭代(微信是十几年打磨出来的)
- 真机测试、灰度、十亿级压测
- 安全/支付牌照/合规
- 人类工程师 review 与决策
一句话结论
微信生态约 7000 万行代码(5000万~1亿区间);用 AI 从零重写,理论纯输出下限约 7 亿 token,但真实工程化开发(含读上下文、思考、返工、测试)需 约 1000 亿 token(500亿~2000亿区间),折合纯模型费用约 百万美元量级。
而且必须说清:token 够了也造不出微信——它真正的壁垒是十几年的产品演进、十亿级分布式工程经验和生态,而不是代码行数本身。