alien
/
Digital_Human


			
				
					
						
						
							123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102103104105106107108109110111112113114115116117118119120121122123124125126127128129130131132133134135136137138139140141142143144145146147148149150151152153154155156157158159160161162163164165166167168169170171172173174175176177178179180181182183184185186187188189190191192193194195196197198199200201202203204205206207208209210211212213214215216217218219220221222223224225226227228229230231232233234235236237238239240241242243244245246247248249250251252253254255256257258259260261262263264265266267268269270271272273274275276277278279280281282283284285286287288289290291292293294295296297298299300301302303304305306307308309310311312313314315316317318319320321
							# 启用bash的扩展功能
shopt -s extglob

# 检查参数是否传入
if [ $# -eq 0 ]; then
    echo "Error: Insufficient parameters"
    echo
    echo "Usage:"
    echo "  ./run_train_and_cloneb.sh \"input_video\""
    echo
    echo "Examples:"
    echo "  ./run_train_and_cloneb.sh \"path/to/your/video.mp4\""
    exit 1
fi

# 定义核心变量
INPUT_VIDEO="$1"

# 获取脚本所在目录
SCRIPT_DIR=$(cd "$(dirname "${BASH_SOURCE[0]}")" && pwd)/
cd "$SCRIPT_DIR" || exit 1

# 使用固定的预生成 avatar 目录（不生成时间戳）
# 如果需要生成新的，取消下面的注释并注释掉固定名称
AVATAR_ID="wav2lip256_avatar1"
# TIMESTAMP=$(date +%Y%m%d_%H%M%S)
# AVATAR_ID="avatar_${TIMESTAMP}"
AVATAR_DIR="${SCRIPT_DIR}data/avatars/${AVATAR_ID}"

# 不自动删除 avatar 目录（因为是预生成的）
# cleanup_avatar_dir() {
#     if [ -n "${AVATAR_DIR:-}" ] && [ -d "${AVATAR_DIR}" ]; then
#         echo "Cleaning generated avatar directory: ${AVATAR_DIR}"
#         rm -rf -- "${AVATAR_DIR}"
#     fi
# }
# trap 'cleanup_avatar_dir' EXIT

# 默认环境变量（可通过外部传入覆盖）
: "${CUDA_VISIBLE_DEVICES:=4,5,7}"
: "${AIOICE_PORT_MIN:=50000}"
: "${AIOICE_PORT_MAX:=50010}"
: "${AIOICE_BIND_IP:=192.168.22.9}"
: "${WEBRTC_NAT_IP:=183.252.196.135}"
# PyTorch 显存优化
: "${PYTORCH_CUDA_ALLOC_CONF:=max_split_size_mb:512,expandable_segments:True}"
# 禁用 TorchDynamo 编译（避免 VoxCPM2 兼容性问题）
: "${TORCHDYNAMO_DISABLE:=1}"
# RTMP 推流配置（使用 nginx-rtmp + FFmpeg）
: "${ENABLE_RTMP:=true}"  # 是否启用 RTMP 推流（默认启用）
: "${TRANSPORT_MODE:=webrtc}"  # 传输模式，默认 WebRTC
: "${RTMP_PORT:=1935}"    # RTMP 服务端口
: "${FFMPEG_PUSH:=true}"  # 是否启动本机 FFmpeg 转发
export CUDA_VISIBLE_DEVICES AIOICE_PORT_MIN AIOICE_PORT_MAX AIOICE_BIND_IP WEBRTC_NAT_IP
export PYTORCH_CUDA_ALLOC_CONF TORCHDYNAMO_DISABLE

echo "========================================"
echo "Digital Human Generation Pipeline (Green Screen)"
echo "========================================"
echo
echo "Input Video: ${INPUT_VIDEO}"
echo "Avatar ID: ${AVATAR_ID}"
echo "Timestamp: ${TIMESTAMP}"
echo "Using env: CUDA_VISIBLE_DEVICES=${CUDA_VISIBLE_DEVICES} AIOICE_BIND_IP=${AIOICE_BIND_IP} WEBRTC_NAT_IP=${WEBRTC_NAT_IP} AIOICE_PORT_MIN=${AIOICE_PORT_MIN} AIOICE_PORT_MAX=${AIOICE_PORT_MAX}"
echo

# 检查输入视频是否存在
if [ ! -f "${INPUT_VIDEO}" ]; then
    echo "Error: Input video not found: ${INPUT_VIDEO}"
    exit 1
fi

echo "Current Directory: $(pwd)"
echo

# ========================================
# Step 1: 调用 API 转换视频背景到绿幕
# ========================================
echo
echo "[Step 1/3] Calling API for video background conversion..."
echo

# 确保 back/video 目录存在
mkdir -p "${SCRIPT_DIR}back/video"

# 生成输出文件名
INPUT_BASENAME=$(basename "${INPUT_VIDEO}" | sed 's/\.[^.]*$//')
GREENSCREEN_VIDEO="${SCRIPT_DIR}back/video/${INPUT_BASENAME}_greenscreen.mp4"

echo "Converting video to green screen via API..."
echo "  Input: ${INPUT_VIDEO}"
echo "  Output: ${GREENSCREEN_VIDEO}"
echo "  API: http://183.252.196.135:6001"
echo

# 调用 RVM GreenScreen API，传递输出文件路径
python back/back_api.py "${GREENSCREEN_VIDEO}"

if [ $? -ne 0 ]; then
    echo "Error: API video conversion failed!"
    cd "${SCRIPT_DIR}" || exit 1
    exit 1
fi

# 检查输出文件是否存在
if [ ! -f "${GREENSCREEN_VIDEO}" ]; then
    echo "Error: Green screen video not generated!"
    cd "${SCRIPT_DIR}" || exit 1
    exit 1
fi

echo
echo "Green screen conversion completed!"
echo "Generated Video: ${GREENSCREEN_VIDEO}"
echo

# ========================================
# Step 2: Run genavatar.py for pre-processing
# ========================================
echo
echo "[Step 2/3] Running genavatar.py for pre-processing..."
echo

# 进入wav2lip目录
cd "${SCRIPT_DIR}wav2lip" || exit 1

echo "Generating avatar data with:"
echo "  Video: ${GREENSCREEN_VIDEO}"
echo "  Avatar ID: ${AVATAR_ID}"
echo "  Image Size: 256"
echo

# 运行 genavatar.py
python genavatar.py --video_path "${GREENSCREEN_VIDEO}" --img_size 256 --avatar_id "${AVATAR_ID}"

if [ $? -ne 0 ]; then
    echo "Error: genavatar.py failed!"
    cd "${SCRIPT_DIR}" || exit 1
    exit 1
fi

cd "${SCRIPT_DIR}" || exit 1

echo
echo "Pre-processing completed!"
echo "Avatar data saved to: data/avatars/${AVATAR_ID}"
echo

# ========================================
# Step 3: 测试 VoxCPM2 API TTS 服务 + 运行 app.py
# ========================================
echo
echo "[Step 3/4] Testing VoxCPM2 API TTS service..."
echo

# VoxCPM2 API 服务配置
VOXCPM2_API_URL="http://183.252.196.135:6003"

echo "Testing VoxCPM2 API TTS service..."
echo "  API 地址：${VOXCPM2_API_URL}"
echo

# 先测试 API 服务是否可用（重试3次）
API_READY=false
for i in 1 2 3; do
    if curl -s --max-time 5 ${VOXCPM2_API_URL}/health > /dev/null 2>&1; then
        API_READY=true
        break
    fi
    echo "   等待 API 启动... (${i}/3)"
    sleep 2
done

if [ "${API_READY}" != "true" ]; then
    echo "❌ VoxCPM2 API 服务无法连接：${VOXCPM2_API_URL}"
    echo
    echo "请确保远程服务器已启动 VoxCPM2 API 服务："
    echo "  SSH到服务器: ssh root@183.252.196.135"
    echo "  然后: ssh test@192.168.22.9"
    echo "  启动服务: cd /mnt/nvme1data/model && python voxcpm2_api.py"
    echo
    echo "如果服务已启动，请建立 SSH 隧道："
    echo "  ssh -f -N -L 6003:192.168.22.9:6003 root@183.252.196.135"
    echo
    exit 1
fi

echo "✅ VoxCPM2 API 服务正常"
curl -s ${VOXCPM2_API_URL}/health | python -m json.tool 2>/dev/null || true
echo

# 测试 TTS 生成
echo "🧪 测试 TTS 音频生成..."
python voxcpm_api.py

if [ $? -ne 0 ]; then
    echo "⚠️  TTS 测试失败，但将继续启动数字人服务"
else
    echo "✅ TTS 测试成功"
fi

echo
echo "========================================"
echo "[Step 4/4] 启动数字人服务（API 调用模式）"
echo "========================================"
echo

echo "Starting digital human server..."
echo "Avatar ID: ${AVATAR_ID}"
echo "TTS: voxcpm2api (VoxCPM2 API 调用模式 - 显存隔离)"
echo "API URL: ${VOXCPM2_API_URL}"
echo "Model: /mnt/nvme1data/model/VoxCPM2 (独立进程)"
echo "Transport: ${TRANSPORT_MODE}"
if [ "${ENABLE_RTMP}" = "true" ]; then
    echo "RTMP Push URL: ${PUSH_URL}"
    echo "Jump Server Command:"
    echo "  ffmpeg -i rtmp://127.0.0.1:1935/live/${AVATAR_ID} -c copy -f flv \"rtmp://livepush.ailien.shop/alien/people?auth_key=...\""
fi
echo
echo "优势："
echo "  ✅ 模型显存独立（~8GB），不影响数字人渲染"
echo "  ✅ 多个数字人实例可共用同一 API 服务"
echo "  ✅ API 崩溃不影响数字人主进程"
echo "  ✅ 更新模型只需重启 API，无需停数字人"
echo
echo "访问地址："
echo "  Web 界面：http://localhost:7868/dashboard.html"
echo "  API 健康检查：${VOXCPM2_API_URL}/health"
echo
echo "Press Ctrl+C to stop the server."
echo

# 检查并安装pyaudio
echo "Checking pyaudio installation..."
python -c "import pyaudio" 2>/dev/null || (echo "Installing pyaudio..." && pip install pyaudio)

# ========================================
# Step 3.1: 检查并配置 nginx-rtmp（如果需要）
# ========================================
if [ "${ENABLE_RTMP}" = "true" ]; then
    echo
    echo "[Step 3.1/4] Checking nginx-rtmp configuration..."
    echo
    
    # 检查 nginx RTMP 模块是否已安装
    if dpkg -l | grep -q libnginx-mod-rtmp; then
        echo "✅ nginx-rtmp-module is already installed"
    else
        echo "⚠️  nginx-rtmp-module not found. Please run:"
        echo "   sudo bash setup_nginx_rtmp.sh"
        echo
        echo "Continuing without RTMP support..."
        ENABLE_RTMP="false"
    fi
    
    if [ "${ENABLE_RTMP}" = "true" ]; then
        # 检查 nginx 是否运行
        if systemctl is-active --quiet nginx; then
            echo "✅ nginx is running"
        else
            echo "Starting nginx..."
            sudo systemctl start nginx
            if [ $? -eq 0 ]; then
                echo "✅ nginx started successfully"
            else
                echo "❌ Failed to start nginx"
                ENABLE_RTMP="false"
            fi
        fi
        
        # 设置推流地址
        # app.py 推送到 nginx-rtmp，跳板机从 nginx-rtmp 拉流
        PUSH_URL="rtmp://127.0.0.1:${RTMP_PORT}/live/${AVATAR_ID}"
        TRANSPORT_MODE="rtcpush"
        
        echo
        echo "RTMP Configuration:"
        echo "  Push URL: ${PUSH_URL}"
        echo "  Jump Server Pull: ffmpeg -i rtmp://127.0.0.1:1935/live/${AVATAR_ID} -c copy -f flv \"rtmp://cdn...\""
        echo
    fi
else
    PUSH_URL=""
    TRANSPORT_MODE="webrtc"
fi

# 启动 app.py
# 关键环境变量说明：
#   AIOICE_PORT_MIN/MAX  : aiortc 绑定的 UDP 端口范围，必须与防火墙放行范围一致
#   AIOICE_BIND_IP       : aiortc 只绑定这一个 IP（服务器有多网卡时，指定浏览器能路由到的那个）
#   WEBRTC_NAT_IP        : 如果浏览器用的是跳板机 IP 而非服务器 IP，设置此项做 SDP IP 替换
#
# 默认值（可通过外部传入环境变量覆盖）：
#   CUDA_VISIBLE_DEVICES=6,7  (使用 GPU 6,7 运行)
#   AIOICE_PORT_MIN=50000  AIOICE_PORT_MAX=50010
#   AIOICE_BIND_IP=192.168.22.9  WEBRTC_NAT_IP=183.252.196.135
#
echo "Using env: CUDA_VISIBLE_DEVICES=${CUDA_VISIBLE_DEVICES} AIOICE_BIND_IP=${AIOICE_BIND_IP} WEBRTC_NAT_IP=${WEBRTC_NAT_IP} AIOICE_PORT_MIN=${AIOICE_PORT_MIN} AIOICE_PORT_MAX=${AIOICE_PORT_MAX}"

CUDA_VISIBLE_DEVICES="${CUDA_VISIBLE_DEVICES}" \
AIOICE_BIND_IP="${AIOICE_BIND_IP}" \
WEBRTC_NAT_IP="${WEBRTC_NAT_IP}" \
AIOICE_PORT_MIN="${AIOICE_PORT_MIN}" \
AIOICE_PORT_MAX="${AIOICE_PORT_MAX}" \
python app.py \
    --avatar_id "${AVATAR_ID}" \
    --tts voxcpm2api \
    --VOXCPM2_API_URL ${VOXCPM2_API_URL} \
    --VOXCPM2_REF_WAV voice_output.wav \
    --VOXCPM2_REF_TEXT "你好，买水果，卖水果，新鲜的水果。" \
    --CFG_VALUE 1.5 \
    --INFERENCE_TIMESTEPS 10 \
    --model wav2lip \
    --transport ${TRANSPORT_MODE} \
    ${PUSH_URL:+--push_url "${PUSH_URL}"} \
    --listenport 7868

echo
echo "========================================"
echo "Pipeline completed!"
echo "========================================"