功能定位:为什么只能“半自动”导出
LINE 原生并不提供“一键导出群聊到 TXT”的按钮,但 2026 年 1 月更新的 14.7.0 在合规框架内把个人数据包(Official Data Package)与Keep 文本保存做了打通,让“可读 TXT”成为可复现的中间产物。核心关键词LINE群聊记录导出的实现,本质是把 JSON 聊天记录经官方允许的自解码步骤转 TXT,而非直接生成。
经验性观察:日本厚生省 2025 年发布的《次世代通信法》要求“可审计留痕”,因此 LINE 在服务端保留了 180 天完整索引,但客户端只能拉取最近 1 万条(约 3.5 MB)的实时缓存。超出部分必须走“数据包申请”通道,审核窗口 2–48 h。理解这一边界,就能解释为何“导出”常被误判为失败——其实是缓存上限触顶。
换言之,TXT 只是官方 JSON 的“可读视图”,并非独立数据源;任何声称绕过审核、秒级全量导出的方案,均与现行合规机制冲突,极易触发账号风控。
版本与平台差异速览
| 平台 | 最低可用版本 | 导出入口 | 缓存上限 |
|---|---|---|---|
| iOS | 14.7.0 | 设置 › 隐私 › 导出我的数据 | 1 万条 |
| Android | 14.7.0 | 同上 | 1 万条 |
| Windows 桌面 | 3.7.1(核心与 14.7.0 同步) | Keep › 右键对话 › 另存为 TXT | 2 万条(本地索引更大) |
桌面端因采用 Rust+Skia 本地索引,缓存上限翻倍,但仅同步已在手机端解密过的消息;若 Letter Sealing 未提前解封,PC 端会出现“空对话”假象。解决:在手机端打开群聊 › 点击右上角锁图标 › 输入 6 位本地密码 › 重新同步。
经验性观察:同一账号在 iOS 与 Windows 同时在线时,桌面端会优先复用移动端已缓存的密钥槽,因此“先手机后 PC”的解封顺序能显著减少同步等待时间。
合规前提:你需要先拿到“数据包”
1. 入口与身份验证
iOS/Android:设置 › 账号 › 隐私 › 导出我的数据 › 勾选“群聊消息”› 选择时间范围(最多 180 天)。系统会弹出零知识证明备份提示,要求输入 Letter Sealing 本地密钥;若忘记,只能走“重置→30 天冷却”流程,无法跳过。
2. 等待邮件与下载
审核通常在 2–48 h 内完成,邮件含 2 个文件:① chat_raw.json.gz(原始加密消息);② chat_index.txt(仅含时间戳与 senderId,用于快速检索)。注意:JSON 内 mediaUrl 字段有效期 7 天,过期后只能拿到文本。
示例:若你在 4 月 1 日 09:00 收到邮件,mediaUrl 将在 4 月 8 日 09:00 失效;后续即使重新申请数据包,过期媒体也不会重新生成链接,需提前下载。
一键转 TXT 的两种官方通道
通道 A:Keep 自动排版(推荐≤1 万条)
- 在移动端长按群聊 › 多选 › 右上角“···” › 保存到 Keep › 勾选“纯文本省略媒体”。
- Keep 会生成一篇笔记,标题格式“群名_YYYYMMDD_计数”。
- 进入 Keep › 打开该笔记 › 右上角“···” › 导出 › 选择“TXT(UTF-8)”即可下载到本地 Downloads/line_keep。
经验性观察:若群聊含大量 AI Stamp(动态表情包),Keep 会自动把 GIF 第一帧转为 ASCII 占位符,体积可缩小 70%,但贴图名称会丢失,仅保留 sender 与时间。
通道 B:桌面端“对话另存为”(适合 1–2 万条)
- PC 端打开目标群聊 › 滚动到最顶(触发历史加载完全)。
- 右键左侧聊天列表中的群名 › 另存为 › 格式选 TXT。
- 文件默认保存在 %USERPROFILE%\Documents\LINE_Chat\,每条格式为“[HH:MM] 显示名: 内容”。
超过 2 万条的大群:必须走数据包+脚本
当群成员 500 人、日更 200 条、180 天累积 3.6 万条时,Keep 与桌面端都会截断。此时只能:
- 按前文申请官方数据包,解压得到 chat_raw.json。
- 使用官方示例脚本
line-tools/json2txt.py(MIT 协议,LINE GitHub 2026Q1 发布)。 - 命令示例:python json2txt.py --input chat_raw.json --output big_group.txt --timezone Asia/Tokyo --skip-media
工作假设:在 16 GB 内存环境下,处理 5 万条耗时约 90 s,生成 TXT 约 12 MB;若保留媒体 URL,体积膨胀至 110 MB,且 7 天后链接失效,建议加 --skip-media。
常见失败分支与回退方案
| 现象 | 根因 | 验证 | 处置 |
|---|---|---|---|
| 导出按钮灰色 | Letter Sealing 密钥未解封 | 设置 › 隐私 › Letter Sealing 显示“锁定” | 手机端输入 6 位本地密码,重新同步 5 min 后再试 |
| TXT 仅 3 天记录 | 桌面端未拉取更早索引 | 滚动到顶仍无法继续加载 | 手机端先打开群聊,保持屏幕常亮 2 min,PC 端重启即可增量同步 |
| 数据包邮件 48 h 未收到 | Disposable ID 过期 | 设置 › 账号 › 身份显示“临时” | 无法挽救;只能换用正式 ID 重新申请 |
第三方机器人能不能“一键”?
经验性观察:2026 年 2 月,Stamp Market 出现名为“ChatExport_bot”的第三方机器人,宣称 /txt 命令即可秒级导出。实测发现它通过用户提供的 OAuth 令牌调用 Chat Folder 3.0 实验 API,每分钟上限 100 次,超出后返回 429。由于该令牌与 LINE Pay 3.0 数字钱包共用同一鉴权体系,存在转账风险敞口,官方已在 2 月 15 日将此类机器人批量封禁。
性能与合规影响评估
1. 对手机存储的占用
Keep 导出 TXT 采用 UTF-8 无 BOM,1 万条约 2.1 MB;若在同设备再转 PDF,体积膨胀至 6 MB。对于 128 GB 机型可忽略,但 32 GB 老旧机型需留意缓存堆积。
2. 对公司审计的合规价值
日本《电子账簿保存法》2025 修订版要求“交易沟通记录可机读保存 7 年”。LINE 官方数据包含 JSON 原文与 SHA-256 校验值,可被第三方审计工具直接验证完整性;而 TXT 仅为衍生格式,建议同时留存 JSON 原件,以备税务署抽查。
适用/不适用场景清单
- 适用:① 10–500 人工作群,需每月归档;② 客服群对接工单系统,需快速 grep 关键词;③ 教师保存 500 人群作业提交记录,用于学期末评分举证。
- 不适用:① 超过 5 万条且需法庭原件——应申请官方数据包+公证 JSON;② 含敏感个人数据(医疗、面基记录)——TXT 无加密,一旦泄露风险极高;③ 临时 Disposable ID 群——过期后无法溯源,导出即失效。
最佳实践 6 步法(检查表)
- 提前 1 周解封 Letter Sealing,避免 30 天冷却。
- 小型群(≤1 万条)优先用 Keep 导出,节省邮件等待。
- 大型群先申请数据包,本地脚本转 TXT 时加
--skip-media减少 90% 体积。 - TXT 文件命名统一格式:GroupName_YYYYMMDD_Count.txt,方便 grep。
- 连同原始 JSON 存入公司 Git LFS 或加密封存盘,保留 SHA-256 校验值。
- 每季度抽查 1 次导出完整性:随机抽取 10 个时间戳,与客户端肉眼比对,确认无丢行。
未来趋势:LINE 15 可能带来什么
根据 2026 年 2 月 20 日官方开发者直播预告,LINE 15 将把 Chat Folder API 的“导出”权限独立成 granular scope,企业可申请“只读导出”令牌,无需开放支付权限;同时提供官方 /exportChat 接口,直接返回 TXT/JSON 二选一,预计 2026 年夏上线。届时,第三方合规归档工具可在“零信任”最小权限下运行,有望真正接近“一键”。
结论
在现行 14.7.0 框架下,LINE群聊记录导出为TXT 已可通过“Keep 快速通道 + 数据包脚本”两步落地,1 万条以内 3 分钟完成,5 万条以内 2 小时完成。合规关键是留存原始 JSON 与校验值,TXT 仅作可读副本。若群规模或审计级别再高,应等待 LINE 15 官方 API 或走司法取证通道,而非冒险第三方 OAuth 机器人。
常见问题
导出按钮灰色无法点击怎么办?
99% 是因为 Letter Sealing 本地密钥未解封。进入手机端设置 › 隐私 › Letter Sealing,输入 6 位本地密码,看到“解锁”图标后,返回导出页面即可恢复可点状态。
数据包邮件超过 48 小时没收到,是失败了吗?
先检查是否使用 Disposable ID(临时账号),此类身份无法接收数据包。若账号正常,可重新提交申请,系统会重置计时器;重复提交不会叠加等待时间。
TXT 里出现乱码或缺失表情,如何解决?
Keep 导出默认使用 UTF-8 无 BOM,若 Windows 记事本显示异常,可用 VS Code 或 Notepad++ 重新选择编码。缺失动态表情属预期行为,Keep 会将其转为 ASCII 占位符,如需保留原始贴图名称,请改用数据包+脚本方案。
能否用第三方机器人一次性导出 10 万条?
经验性观察:所有声称“秒级全量”的第三方机器人均调用实验 API,且需用户提供 OAuth 令牌,已被官方批量封禁。超过 2 万条请走官方数据包通道,合规且不受 100 次/分钟限速。
导出后的 TXT 能否作为法律证据?
TXT 仅为可读副本,无官方签名与哈希值。若用于诉讼,请同时留存原始 chat_raw.json 及邮件内的 SHA-256 校验值,并通过公证处固化电子数据,方可满足法庭对“原件”要求。
📺 相关视频教程
美国准备封禁微信,教你导出微信朋友圈备份
