AI摘要介绍
肉包是一款基于 Android 原生 Kotlin 开发的开源 AI 手机自动化助手,首次实现纯移动端、无需电脑的自然语言驱动操作。
肉包(Roubao)是一款无需电脑、纯移动端原生实现的开源 AI 手机自动化工具,基于 Android 原生 Kotlin 开发,以视觉语言模型(VLM)和多 Agent 协作架构为核心,让普通用户也能通过自然语言指令,让手机自动完成各类任务。

核心优势:告别繁琐,轻量化自动化
1. 彻底摆脱电脑依赖
区别于传统 Python 脚本 + ADB 的自动化方案,肉包全程在手机本地完成截图分析、指令执行,无需电脑中转,仅需一次性 Shizuku 授权(无 Root 风险),即可实现全流程移动端操作。
2. 智能的双层执行架构
采用 Tools+Skills 双层 Agent 架构,兼顾效率与兼容性:
- Tools 层:封装打开 App、DeepLink 跳转、屏幕操作等原子能力;
- Skills 层:将自然语言映射为具体操作,优先通过 DeepLink 委托 AI 应用(小美 / 豆包)一键完成,无 AI 能力的 App(美团 / 微信)则自动切换 GUI 自动化执行。
3. 原生体验 + 高颜值 UI
- 基于 Kotlin 原生开发,适配 Android 8.0+,流畅无卡顿;
- 采用 Material 3 设计语言,支持深浅色自适应、流畅动画,是同类开源项目中 UI 体验最优的版本,还提供中英双语支持。
4. 开源免费,无硬件门槛
对比闭源且需高价硬件的同类产品,肉包基于 MIT 协议完全开源,无需购买专用设备,普通 Android 手机即可使用。
| 特性 | 肉包 | 同类闭源产品 | 传统开源方案 |
|---|---|---|---|
| 电脑依赖 | ❌ | ❌ | ✅ |
| 硬件成本 | ❌ | ✅(3499 元 +) | ❌ |
| 开发语言 | Kotlin(原生) | 原生 | Python(非原生) |
| 开源协议 | MIT | ❌ | 部分支持 |
能做什么?极简自然语言操控
只需输入自然语言指令,肉包即可自动完成各类操作:
- 📱 打开网易云音乐播放每日推荐
- 🍔 美团 / 饿了么自动点附近的汉堡
- 📸 把照片发到朋友圈 / 微博
- 📺 打开 B 站点赞指定视频
- 📖 生成并发布小红书笔记
支持用户自定义 Skills,满足个性化自动化需求。
技术核心:轻量且高效
核心架构
肉包采用多 Agent 协作模式,分工明确:
- Manager:解析用户意图,拆分 / 调整执行计划;
- Executor:分析屏幕状态,执行点击 / 滑动等操作;
- Reflector:评估操作结果,识别异常;
- Notetaker:记录执行信息,提供上下文。
核心代码结构清晰,聚焦自动化核心能力:
纯文本
app/src/main/java/com/roubao/autopilot/
├── agent/ # 多Agent核心逻辑
├── tools/ # 原子能力层
├── skills/ # 意图映射层
├── controller/ # 设备控制(Shizuku)
└── ui/ # 高颜值UI层快速上手
普通用户
- 从GitHub Releases下载 APK 安装;
- 授权 Shizuku 权限,配置 API Key;
- 输入自然语言指令即可使用。
开发者
Bash/Shell
# 克隆仓库
git clone https://github.com/Turbo1123/roubao.git
cd roubao
# 构建并安装
./gradlew assembleDebug && ./gradlew installDebug环境要求:Android Studio Hedgehog+、JDK 17、Android SDK 34。
未来规划(v2.0)
- 🚀 无障碍服务混合模式:优先元素索引点击,失败自动切坐标模式;
- 🚀 UI 树感知:读取完整 UI 结构,减少视觉识别误判;
- 🚀 宏脚本系统:录制 / 回放操作序列;
- 🚀 本地模型支持:离线使用,无需联网;
- 🚀 语音控制:语音唤醒 / 指令执行。
参与贡献
肉包欢迎开发者共建:
- Fork 仓库,创建特性分支;
- 提交代码并推送;
- 发起 Pull Request。
Bug 反馈请通过GitHub Issues,附问题描述、复现步骤及日志文件。