肉包 (Roubao):首款无电脑开源 AI 手机自动化助手

· · 2,099 字 · 约 6 分钟
67 0
AI摘要介绍

肉包是一款基于 Android 原生 Kotlin 开发的开源 AI 手机自动化助手,首次实现纯移动端、无需电脑的自然语言驱动操作。


肉包(Roubao)是一款无需电脑、纯移动端原生实现的开源 AI 手机自动化工具,基于 Android 原生 Kotlin 开发,以视觉语言模型(VLM)和多 Agent 协作架构为核心,让普通用户也能通过自然语言指令,让手机自动完成各类任务。

核心优势:告别繁琐,轻量化自动化

1. 彻底摆脱电脑依赖

区别于传统 Python 脚本 + ADB 的自动化方案,肉包全程在手机本地完成截图分析、指令执行,无需电脑中转,仅需一次性 Shizuku 授权(无 Root 风险),即可实现全流程移动端操作。

2. 智能的双层执行架构

采用 Tools+Skills 双层 Agent 架构,兼顾效率与兼容性:
  • Tools 层:封装打开 App、DeepLink 跳转、屏幕操作等原子能力;
  • Skills 层:将自然语言映射为具体操作,优先通过 DeepLink 委托 AI 应用(小美 / 豆包)一键完成,无 AI 能力的 App(美团 / 微信)则自动切换 GUI 自动化执行。

3. 原生体验 + 高颜值 UI

  • 基于 Kotlin 原生开发,适配 Android 8.0+,流畅无卡顿;
  • 采用 Material 3 设计语言,支持深浅色自适应、流畅动画,是同类开源项目中 UI 体验最优的版本,还提供中英双语支持。

4. 开源免费,无硬件门槛

对比闭源且需高价硬件的同类产品,肉包基于 MIT 协议完全开源,无需购买专用设备,普通 Android 手机即可使用。
特性 肉包 同类闭源产品 传统开源方案
电脑依赖
硬件成本 ✅(3499 元 +)
开发语言 Kotlin(原生) 原生 Python(非原生)
开源协议 MIT 部分支持

能做什么?极简自然语言操控

只需输入自然语言指令,肉包即可自动完成各类操作:
  • 📱 打开网易云音乐播放每日推荐
  • 🍔 美团 / 饿了么自动点附近的汉堡
  • 📸 把照片发到朋友圈 / 微博
  • 📺 打开 B 站点赞指定视频
  • 📖 生成并发布小红书笔记
支持用户自定义 Skills,满足个性化自动化需求。

技术核心:轻量且高效

核心架构

肉包采用多 Agent 协作模式,分工明确:
  • Manager:解析用户意图,拆分 / 调整执行计划;
  • Executor:分析屏幕状态,执行点击 / 滑动等操作;
  • Reflector:评估操作结果,识别异常;
  • Notetaker:记录执行信息,提供上下文。
核心代码结构清晰,聚焦自动化核心能力:
纯文本
app/src/main/java/com/roubao/autopilot/
├── agent/        # 多Agent核心逻辑
├── tools/        # 原子能力层
├── skills/       # 意图映射层
├── controller/   # 设备控制(Shizuku)
└── ui/           # 高颜值UI层

快速上手

普通用户

  1. GitHub Releases下载 APK 安装;
  2. 授权 Shizuku 权限,配置 API Key;
  3. 输入自然语言指令即可使用。

开发者

Bash/Shell
# 克隆仓库
git clone https://github.com/Turbo1123/roubao.git
cd roubao

# 构建并安装
./gradlew assembleDebug && ./gradlew installDebug
环境要求:Android Studio Hedgehog+、JDK 17、Android SDK 34。

未来规划(v2.0)

  • 🚀 无障碍服务混合模式:优先元素索引点击,失败自动切坐标模式;
  • 🚀 UI 树感知:读取完整 UI 结构,减少视觉识别误判;
  • 🚀 宏脚本系统:录制 / 回放操作序列;
  • 🚀 本地模型支持:离线使用,无需联网;
  • 🚀 语音控制:语音唤醒 / 指令执行。

参与贡献

肉包欢迎开发者共建:
  1. Fork 仓库,创建特性分支;
  2. 提交代码并推送;
  3. 发起 Pull Request。
Bug 反馈请通过GitHub Issues,附问题描述、复现步骤及日志文件。
微信二维码