Releases: LC044/WeChatMsg
JSON支持GLM4微调数据集
新增功能
JSON支持GLM4微调数据集
GLM4微调数据格式:
{
"messages": [
{
"role": "system",
"content": "你是司小远,一个聪明、热情、善良的人,后面的对话来自你的朋友,你要认真地回答他"
},
{
"role": "user",
"content": "用1.1.2可以,源码不行"
},
{
"role": "assistant",
"content": "看看那个文件夹,完了,我也不行了"
}
]
}
新增隐私保护
导出数据集自动过滤手机号、邮箱、身份证号、账号密码这些隐私信息,可放心训练AI大模型。
# 正则表达式模式
patterns = {
'phone': r'\b(\+?86[-\s]?)?1[3-9]\d{9}\b', # 手机号
'email': r'\b[A-Za-z0-9._%+-]+@[A-Za-z0-9.-]+\.[A-Z|a-z]{2,}\b', # 邮箱
'id_card': r'\b\d{15}|\d{18}|\d{17}X\b', # 身份证号
'password': r'\b(?:password|pwd|pass|psw)[\s=:]*\S+\b', # 密码
'account': r'\b(?:account|username|user|acct)[\s=:]*\S+\b' # 账号
}
JSON支持修改模型、assistant、数据集占比、导出策略等
assistant设置为“自己”时导出的数据集用于训练自己说话风格的AI,assistant设置为“好友”时导出的数据集用于训练好友说话风格的AI。
system
角色为可选角色,但若存在 system
角色,其必须出现在 user
角色之前,且一个完整的对话数据(无论单轮或者多轮对话)只能出现一次 system
角色。
system
角色可以描述模型的应用场景与前置条件。MemoTrace的默认prompt描述了AI助手的对话场景,你可以根据需要修改prompt。
你是{{name}},一个聪明、热情、善良的人,后面的对话来自{{remark}},你要认真地回答他
{{name}}
会被替换为你的微信昵称(可删){{remark}}
会被替换为联系人的备注(可删)
例如:你的昵称为“司小远”,好友的备注为“李华”,输出结果为:你是司小远,一个聪明、热情、善良的人,后面的对话来自李华,你要认真地回答他
导出策略1
策略1采用的是按时间分组,每组的第一条消息和最后一条消息的时间跨度不大于某个值。默认是300s,也就是每轮对话时间不超过300s,可以通过JSON设置策略1修改该值。
导出策略2
策略2采用的是时间间隔分组法,若每组的相邻两条消息的时间间隔不大于某个固定值则认为是同一轮对话否则认为是开启了新的一轮对话。默认是120s,也就是说你超过两分钟没回信息就被分到下一组了。
导出策略3
策略3采用的是滑动窗口分组法,总消息数为N,每轮对话消息数固定为M即窗口大小为M,以步长为K进行滑动分组。
建议训练时混合使用不同策略、不同参数的数据集以增加数据集的多样性
训练效果
训练指南:https://memotrace.cn/doc/posts/develop/
体验地址:https://chat.memotrace.cn/
一些问答截图
PDF视频添加播放时长
PDF里的视频只有一个封面图,所以无法区分视频和图片,为了解决该问题,PDF在视频右下角添加了视频的总时长。
支持批量导出AI专用TXT
优化
- 优化部分UI
- VIP导出图片默认按时间排序
- 修复HTML导出视频失败的问题
- 修复按时间排序文件夹创建失败的问题
- 修复部分群聊语音时长解析失败的问题
- 修复同时导出HTML和xlsx语音占用问题
- 修复联系人有多个标签显示为none的问题
新增语音转文字功能
v2.0.11
新增功能
AI对话专用格式TXT
每个人能拥有自己的 AI聊天助手是留痕自始至终的愿景,本次更新支持导出AI对话专用格式TXT ,在普通TXT格式的基础上去除了时间信息、合并连续消息,有效降低了字数,单次对话可处理更多的聊天记录,并将聊天中的隐私数据(手机号、邮箱、身份证、密码、账号等)进行了屏蔽保护,用户可根据自己的需求利用大模型得到专属的AI聊天助手并进一步分析聊天数据。
以下对话来自Kimi
支持批量导出docx和PDF
注意:不要选择太多的聊天记录,如果你也像我一样有64G内存的话可以忽略这条建议
导出指定群成员聊天记录支持Docx和PDF
导出的语音文件以时间命名,并区分发送接收方
20200911为语音发送日期,130907为具体时间
- 0:接收的语音
- 1:发送的语音
优化
- 修复非中国大陆导致的日期选择错误问题
- 修复切换账号导致数据混乱问题
- 优化HTML头像、时间轴等功能
- 优化PDF显示
v2.0.10
新功能
双人聊天分析报告
我们设计了明亮系和暗黑系两大视觉主题,每个主题包含了6种颜色主题,一共12个主题。
520特别版
520马上到了,礼物还没准备好?快来选一份心仪的主题送给ta吧!
明亮系
暗黑系
普通版
个人全部聊天分析报告
这时候有人就要问了,单身狗怎么办?我们的口号是:一个人也能玩出花样,不是你优秀而是我精彩。所以我们特地准备了个人聊天报告,无论你是“留言满天下”还是“沉默代表我态度”,在这里都能收获一个只属于你的荣誉称号。
明亮系
![card2.png](https://cdn.nlark.com/yuque/0/2024/png/42745842/1715999143112-9b4aea54-4549-4a4a-95f6-93b11a5031b5.png#averageHue=%2392a7c2&clientId=ue2b9...
支持导出指定群成员的聊天记录
HTML支持按类型筛选
新增功能
HTML支持按类型筛选
支持一键导出图片、视频、文件
PDF新增企业微信名片
朋友圈增加视频类型
图片依旧无法显示
HTML、TXT、xlsx、PDF增加群公告
优化
HTML全面适配移动端
优化语音消息显示
- 修复docx文件引用消息解析失败的问题
- 修复HTML上滑不显示时间的问题
- 修复朋友圈文本不显示换行的问题
- 修复中文名过长导致不能导出的问题
- HTML新增加载动画
- 优化部分图标
链接
官网:https://memotrace.cn/
AI聊天:https://chat.memotrace.cn/
使用教程:https://memotrace.cn/doc/
阿里云盘下载地址:https://www.alipan.com/s/4zCUkaTANM1
百度网盘下载地址:https://pan.baidu.com/s/1Bc7Nnnn4yychMPVFDDAsKA?pwd=ez1k
支持导出所有类型消息
留痕2.0.7迎来重大更新,支持导出微信联系人和企业微信联系人的所有聊天消息类型
微信联系人新增功能
新增小程序消息
- HTML
- PDF:与HTML格式一致
- TXT:
2024-04-21 22:44:21 zs
【视频号】:
物理先森:容嬷嬷:学废了吗?[旺柴]#容嬷嬷教物理
- xlsx:与TXT内容一致
新增视频号消息
- HTML:
- PDF:与HTML格式一致
- TXT:
2024-04-21 22:44:59 zs
【小程序】:
麦当劳:麦当劳自助点餐,喜欢您来!
链接:https://mp.weixin.qq.com/mp/waerrpage?appid=wx25f982a55e60a540&type=upgrade&upgradetype=3#wechat_redirect
- xlsx:与TXT内容一致
支持导出未命名群聊
企业微信联系人新增消息类型
导出的企业微信联系人聊天记录与普通微信联系人聊天记录格式一致
- 合并转发消息
- 文件
- 分享卡片
- 个人名片\公众号名片
- 企业微信名片
- 位置分享
- 小程序
- 视频号
导出文件内容优化
xlsx新增成员信息工作簿(sheet)
工作簿内容包含群聊成员\微信联系人全部信息:
- UserName
- 微信号
- 群昵称
- 昵称
- 头像
- 标签
- 性别
- 电话
- 个性签名
- 国家
- 省份
- 城市
PDF支持显示语音
优化
- 修复部分引用消息和合并转发的消息失败的问题
- 修复xlsx编码格式导致失败的问题
- 修复朋友圈评论溢出问题
- 修复HTML显示乱码的问题
- 优化PDF导出体验
链接
官网:https://memotrace.cn/
AI聊天:https://chat.memotrace.cn/
使用教程:https://memotrace.cn/doc/
阿里云盘下载地址:https://www.alipan.com/s/4zCUkaTANM1
百度网盘下载地址:https://pan.baidu.com/s/1Bc7Nnnn4yychMPVFDDAsKA?pwd=ez1k
支持导出Excel
新功能
新增聊天记录导出Excel
Excel是一款功能强大的电子表格软件,具有数据存储、数据计算、数据分析、数据筛选和排序、数据合并和拆分、图表展示数据以及自动化办公等功能,对聊天记录的查看和数据分析有很大帮助。
导出某个好友记录Excel
批量导出Excel
Excel导出格式
导出Excel支持显示文本、图片,包含语音、视频、文件超链接,导出格式为:
- 消息ID:
- 类型:文本、图片、文件、表情包、引用消息、系统消息等
- 发送人
- 时间
- 内容:文本、图片、语音、视频、文件
- 备注
- 昵称
消息类型展示
- 系统通知
- 文本消息
- 图片消息
图片设置为嵌入单元格模式,若要查看完整图片可以设置单元格行高、列宽或者直接改变图片大小
原格式
设置行高、列宽充分展示图片
直接改变图片大小
- 语音消息
点击超链接可打开播放语音文件
- 视频消息
- 文件
- 位置
其他消息类型都在内容一栏里有详细描述
转账信息
2024-01-02 08:43:33 司小远
【接受转账】:已收款 ¥5.20
备注:啦啦啦
位置分享
2024-03-28 16:42:00 司小远
【位置】:
坐标:('33.976604', '108.753967')
地点:陕西省西安市鄠邑区太平旅游区高尔夫球场西边地质八队东向南 紫阁自然景区
名片分享
2024-01-02 08:44:56 司小远
【名片】:
昵称:司小远 微信号:888
地区:陕西 西安 性别:男
音视频通话
2024-03-18 12:39:47 司小远
【音视频通话】:已取消
2024-03-18 12:40:17 司小远
【音视频通话】:对方已拒绝
2024-03-18 12:40:47 司小远
【音视频通话】:通话时长 00:10
分享的卡片链接
[链接]:title:【更新日志】支持导出指定好友的朋友圈
description:
url:http://mp.weixin.qq.com/s?__biz=Mzg3NDg5MzM1NA==&tempkey=MTI2NV9IUm1DOTdLM203VnRzSzg3TXFEZUFKS3hXbDhMeVpkVnBHYlVlUy1yREl3TlhNeThWem1KdExEX0JyN2laWGRaZGhnQ3FiMlJycmVSOUVrXzNnbFgzcFo4QVF6TnMwRVZpT0lPSUhkTkVhQ0FheTE2RlNwTXZoQVp5a2VVajZsUzNpNFdaSlJMYUxaeDB1bTVwaC1XT2lsRmpPWGZUaUJJTmo5NDlBfn4%3D&chksm=4ec89b3779bf1221cccb903639c4a7a74c343cd0724941f48817ea2aa865bb674544cc386691&mpshare=1&scene=1&srcid=0412nKi9WwEFOBXAPzN8DGQF&sharer_shareinfo=a8b02ad8840811e903eefcf227a3d370&sharer_shareinfo_first=a8b02ad8840811e903eefcf227a3d370#rd
name:忆墨痕
引用消息
【引用消息】
发送内容:你说得对
引用内容:Shuaikang Zhou:你好哦
引用消息ID:5205016166094803101
企业微信聊天记录新增图片、视频、语音
朋友圈新增点赞和评论
新增引用消息点击跳转至原文位置
新增AI助手输出时清除对话
优化
- 修复由于引用消息导致的年度报告bug
- 修复朋友圈导出wxid问题和文本消息转义问题
- 修复部分bug
链接
官网:https://memotrace.cn/
AI聊天:https://chat.memotrace.cn/
使用教程:https://memotrace.cn/doc/
阿里云盘下载地址:https://www.alipan.com/s/4zCUkaTANM1
百度网盘下载地址:https://pan.baidu.com/s/1Bc7Nnnn4yychMPVFDDAsKA?pwd=ez1k
支持导出指定好友的朋友圈
新功能
一、支持导出指定好友的朋友圈
1.1 导出自己朋友圈
1.2 导出指定好友的朋友圈
1.3 可选择导出日期
二、合并转发消息新增图片和视频类型
三、位置分享新增在线地图
四、丰富TXT消息类型
4.1 转账信息
2024-01-02 08:43:33 司小远
【接受转账】:已收款 ¥5.20
备注:啦啦啦
4.2 位置分享
2024-03-28 16:42:00 司小远
【位置】:
坐标:('33.976604', '108.753967')
地点:陕西省西安市鄠邑区太平旅游区高尔夫球场西边地质八队东向南 紫阁自然景区
4.3 名片分享
2024-01-02 08:44:56 司小远
【名片】:
昵称:司小远 微信号:888
地区:陕西 西安 性别:男
4.4 音视频通话
2024-03-18 12:39:47 司小远
【音视频通话】:已取消
2024-03-18 12:40:17 司小远
【音视频通话】:对方已拒绝
2024-03-18 12:40:47 司小远
【音视频通话】:通话时长 00:10
五、丰富引用消息类型
六、我的年度报告支持定义时间范围
七、AI小助手新增客服功能
优化
- 优化存储结构(可以任意移动整个文件夹)
- 修复部分合并转发消息无法点开的问题
- 修复由于非大陆地区导致的日期对话框乱码的问题
- 优化分享卡片显示效果
- 修复部分bug
链接
官网:https://memotrace.cn/
AI聊天:https://chat.memotrace.cn/
使用教程:https://memotrace.cn/doc/
阿里云盘下载地址:https://www.alipan.com/s/4zCUkaTANM1
百度网盘下载地址:https://pan.baidu.com/s/1Bc7Nnnn4yychMPVFDDAsKA?pwd=ez1k
支持合并转发的消息
新功能
HTML新增合并转发消息
HTML中的合并转发消息支持文本消息和嵌套合并转发消息,点击展开查看
PDF新增合并转发消息
PDF中的合并转发消息支持文本消息和嵌套合并转发消息,在合并消息卡片后展开显示,嵌套的合并消息会逐层展开
添加位置坐标
优化
- 添加错误日志类型
- 修复部分bug
2.0.5开发计划
- 导出指定好友朋友圈
- 添加红包消息
- 在线获取位置信息
- 优化引用消息,支持点击跳转
需求留言
为了让“留痕”能够更加智能,更加贴近用户的需求,我特别诚邀你们在留言区分享你们对“留痕”的期望和建议。无论是对功能的增添,还是对界面的改良,你们的每一条建议都将是我们前行的不竭动力。让我们共舞墨香,共绘华章,携手打造操作最简单、功能最全面、创意最丰富的聊天记录管理软件。
链接
官网:https://memotrace.cn/
AI聊天:https://chat.memotrace.cn/
使用教程:https://memotrace.cn/doc/
阿里云盘下载地址:https://www.alipan.com/s/h6fDSP4igcz
百度网盘下载地址:https://pan.baidu.com/s/1Bc7Nnnn4yychMPVFDDAsKA?pwd=ez1k