Speakr是什么
Speakr是开源免费的AI会议助手,支持确保数据绝对私密的前提下,自动化完成会议录音转写、内容摘要提炼与智能问答。Speakr无需联网就能运行,所有数据处理均在本地完成,彻底杜绝商业机密或敏感对话泄露的风险。用户能轻松上传多种格式的音频文件,后台自动进行转录和摘要生成,不干扰用户操作。Speakr提供交互式聊天功能,用户基于聊天界面与转录内容互动,提问或搜索相关信息,提高用户体验。

Speakr的主要功能
- 音频上传与转录:支持多种音频格式(如MP3、WAV、M4A等),用户基于拖拽或选择文件的方式上传音频,系统后台自动进行转录,不阻塞用户界面。
- AI驱动的摘要与标题生成:基于AI技术生成会议的智能摘要和标题,帮助用户快速了解会议的核心内容。
- 交互式聊天:用户基于聊天界面与转录内容互动,提问或搜索相关信息,例如“列出所有待办事项”或“预算讨论部分”。
- 自托管安全性:所有数据都存储在用户自己的服务器上,确保数据的安全性和隐私性,避免敏感信息泄露。
- 用户管理功能:支持用户注册、登录、账户管理和录音资料管理,管理员能进行用户管理和系统统计。
- 多语言支持:支持用户配置音频转录和AI生成内容的语言,满足不同用户的需求。
- 搜索与高亮:支持关键词搜索和内容高亮,方便用户快速定位重要信息。
- 元数据编辑:用户能编辑与录音相关的元数据,如标题、参与者、会议日期、摘要和笔记。
Speakr的技术原理
- 语音识别技术:基于OpenAI兼容的语音转文字(STT)API,如Whisper模型,将音频文件转换为文本。用户能配置使用自托管的Whisper模型或其他兼容的API。
- 自然语言处理(NLP):基于AI驱动的文本摘要和智能问答技术,生成会议的摘要和标题,基于聊天界面与用户互动。
- 后端框架:基于Python和Flask构建后端服务,处理API请求、数据存储和业务逻辑。
- 数据库:用SQLAlchemy ORM和SQLite(默认)进行数据存储,管理用户信息、录音文件和转录内容。
- 前端技术:结合Jinja2模板、Tailwind CSS和Vue.js等技术构建用户界面,提供流畅的用户体验。
- 部署方式:支持Docker和本地部署,通过Docker可以快速部署应用,本地部署适合开发和测试环境。
- 安全机制:基于Flask-Login、Flask-Bcrypt和Flask-WTF等工具实现用户认证和数据保护,确保用户数据的安全性。
Speakr的项目地址
- GitHub仓库:https://github.com/murtaza-nasir/speakr
Speakr的应用场景
- 企业内部会议:企业内部的项目会议、团队会议等,快速生成会议纪要,确保敏感信息不外泄,方便团队成员后续查阅和任务跟进。
- 教育领域:教师将课堂录音上传,生成详细课堂笔记,方便学生复习。
- 远程协作:远程团队的会议记录,确保团队成员能够快速了解会议内容,方便任务分配和项目管理,提高远程协作效率。
- 个人学习与笔记:学生或个人记录重要会议、讲座内容,生成详细笔记,方便后续查阅和复习,提高学习效率。
- 医疗行业:在医疗领域用在病例讨论、培训会议记录,保护患者信息,方便后续查阅。