百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术文章 > 正文

Docker 部署高性能抖音 TikTok数据爬取工具,支持无水印视频下载

nanshan 2025-07-06 15:24 6 浏览 0 评论

一、项目简介

此项目基于 PyWebIO、FastAPI 和 HTTPX,是一个高效的异步数据爬取工具,专注于抖音/TikTok平台的数据提取。通过Web端界面,用户可以在线批量解析并下载无水印的视频或图集。此外,本项目还提供了数据爬取APIiOS快捷指令,用于无水印内容的下载。您可以选择自行部署或对本项目进行改造,以实现更多功能。在您的项目中,可以直接调用 `scraper.py` 文件,或者通过现有的pip包安装,将其作为解析库来轻松获取数据。

支持功能:

  • 网页端批量解析(支持抖音/TikTok混合解析)
  • 在线下载视频或图集。
  • 制作pip包方便快速导入你的项目
  • iOS快捷指令快速调用API实现应用内下载无水印视频/图集
  • 完善的API文档(Demo/演示)
  • 丰富的API接口:抖音网页版API(视频解析、用户信息、用户视频图片、直播流等),TikTok网页版API(视频解析、用户信息、用户视频图片、直播流等)、哔哩哔哩网页版API(单个视频详细信息、视频流地址、用户视频作品等)

二、安装准备

2.1、Docker 安装

确保当前服务器安装了 Docker,如果没有可以自行安装,也可以直接部署。

# docker 信息
docker info

2.2、Cookie 获取(以抖音为例)

登陆网页版抖音,然后随便进入一个用户的主页,按 F12 打开开发者工具。按照下面步骤:选择 Network -> Fetch/XHR -> 刷新页面 -> 点击 post/? 接口 -> 复制 Cookie 所有的值(有用!)。如下图:

三、Docker 部署

3.1、修改Cookie

因为 douyin 风控的原因,需要替换成自己的 Cookie(而且在cookie失效时需要替换)

# 拉取代码
git clone https://github.com/Evil0ctal/Douyin_TikTok_Download_API.git
# 修改cookie 以抖音为例 (tiktok 目录在 crawler/tiktok )
cd Douyin_TikTok_Download_API/crawlers/douyin/web/
# 编辑 config.yaml
vim config.yaml
# 替换cookie,这个参数后面的替换成刚才获取到的cookie
    Cookie: __ac_nonce=06629f03b000ca74fd5d0........

3.2、构建镜像

你可以选择使用 DockerHub 中构建好的镜像,也可以自己构建(推荐,因为要修改配置中的抖音cookie)

# 构建镜像(先安装docker 和 修改Cookie)
docker build -t douyin-tiktok-api:latest .
# 拉取官方镜像
docker pull evil0ctal/douyin_tiktok_download_api:latest

注:如官方镜像拉取失败,请查看这篇文章:国内docker镜像无法访问,通过cloudflare白嫖个人docker镜像加速

3.3、运行容器

# 自己构建的镜像
docker run -itd -p 80:80 --name douyin-tiktok-api --restart=always -v /etc/localtime:/etc/localtime:ro douyin-tiktok-api:latest
# 官方镜像
docker run -itd -p 80:80 --name douyin-tiktok-api --restart=always -v /etc/localtime:/etc/localtime:ro evil0ctal/douyin_tiktok_download_api:latest

3.4、验证容器

  • 容器运行检查
docker ps 
  • 访问地址
# localhost 替换成当前服务器地址
http://localhost:80
# api文档界面
http://localhost:80/docs

3.5、停止和删除容器

# Stop
docker stop douyin-tiktok-api 

# Remove
docker rm douyin-tiktok-api

四、Linux 部署

4.1、部署脚本

# 脚本是在Ubuntu 20.04 LTS上测试的,其他系统可能会有问题,如果有问题请自行解决。
wget -O install.sh https://raw.githubusercontent.com/Evil0ctal/Douyin_TikTok_Download_API/main/bash/install.sh && sudo bash install.sh

4.2、启停命令

# 启动
systemctl start Douyin_TikTok_Download_API.service
# 停止
systemctl stop Douyin_TikTok_Download_API.service

4.3、开机自启

# 添加开机自启
systemctl enable Douyin_TikTok_Download_API.service
# 删除开机自启
systemctl disable Douyin_TikTok_Download_API.service

4.4、更新项目

cd /www/wwwroot/Douyin_TikTok_Download_API/bash && sudo bash update.sh

五、测试截图

  • 抖音用户信息
  • 用户主页视频数据
  • 单个视频详情

六、项目地址

  • 开源地址
https://github.com/Evil0ctal/Douyin_TikTok_Download_API
  • web端体验地址
https://douyin.wtf
  • 文档地址
https://douyin.wtf/docs

相关推荐

爆肝 30 天!从 JVM 调优到百万级 QPS,我的 Java 性能飞升全记录(2)

前言:从崩溃边缘到百万级QPS的逆袭凌晨3点的办公室,监控大屏突然飙红,QPS从5万断崖式下跌到800,CPU满载报警,GC时间突破3秒大关——这是我们的电商大促系统在压测中遭...

如何彻底清除服务器上的恶意软件与后门 ?

当服务器遭受入侵后,清除恶意软件和后门是恢复系统安全性的关键步骤。如果清除不彻底,攻击者可能通过隐藏后门程序再次发动攻击。以下是一个系统化的操作指南,帮助您彻底清除服务器上的恶意软件和后门,同时加强服...

Docker 部署高性能抖音 TikTok数据爬取工具,支持无水印视频下载

一、项目简介此项目基于PyWebIO、FastAPI和HTTPX,是一个高效的异步数据爬取工具,专注于抖音/TikTok平台的数据提取。通过Web端界面,用户可以在线批量解析并下载无水印的视频或...

我如何将Unix时间转换为可读的值?

高频处理时间问题在处理时间值时,程序中的一种常见方法是将其转换为线性刻度表示。无法将"2005年1月17日下午5:37"这样的日期存储为变量,并期望能够进行任何操作。因此,在合格的程序...

用shell进行ASCII字符转换与URL编码技巧

如何将ASCII字符转换为十进制(或十六进制)值并进行相反的转换?如何进行URL编码和URL解码?如果你在编写脚本时已知八进制或十六进制值,你可以使用printf命令实现:#POSIXprintf...

Linux远程shell登录出现bash-4.2#问题

出现以上问题的原因是/root目录下丢失了.bashrc和.bash_profile文件/etc/skel/.bash_profile和/etc/skel/.bashrc的文件复制到/root下即可命...

三部门:推进算力互联互通 推动国家枢纽节点和需求地之间400G/800G 高带宽全光连接

每经AI快讯,1月6日,国家发展改革委等三部门印发《国家数据基础设施建设指引》。其中提出,加强新兴网络技术创新应用,优化网络计费方式,降低东西部数据传输成本,促进东部中高时延业务向西部转移。推进算力互...

三部门:推动国家枢纽节点和需求地之间400G/800G高带宽全光连接

国家发展改革委、国家数据局、工业和信息化部等印发《国家数据基础设施建设指引》的通知。其中提到,加强新兴网络技术创新应用,优化网络计费方式,降低东西部数据传输成本,促进东部中高时延业务向西部转移。推进算...

高带宽低延迟如何开启?实际效果如何?

在上次的《实测AMD平台玩游戏用什么频率的内存更好?》中通过测试已经得知,AMDCPU的最佳频率是6000,具体该如何选择,如何设置能提升游戏帧数,往下看小白新手也能看明白。内存选择6000频率内存...

排列五第22237期规律预测走势图分享

二定头尾:03458,X,X,035890XX00XX30XX50XX80XX93XX03XX33XX53XX83XX94XX04XX34XX54XX84XX95...

格式化字符串漏洞及利用_萌新食用

前言格式化字符串漏洞具有任意地址读,任意地址写。printfprintf--一个参数:情况1当参数只有1个字符串的话(含有%?),//?即i,x,s等等<br>第一个...

Linux配置ip地址的两种方法(linux配置ip详细步骤)

Linux配置ip地址的两种方法,实验环境为centos7.6方法1:nmcli工具配置(centos7以下版本不支持该方法)第一步,通过nmcliconnection查看网卡名称[root@lo...

排列五9月30日第22263期最新规律走势预测讲解

二定头尾:034589,X,X,0125670XX00XX10XX20XX50XX60XX73XX03XX13XX23XX53XX63XX74XX04XX14XX2...

GDB调试的高级技巧(gdb调试工具的使用)

GDB是我们平时调试c/c++程序的利器,查起复杂的bug问题,比打印大法要好得多,但是也不得不说,gdb在默认情况下用起来并不是很好用,最近学习到几个高级点的技巧,分享下:一美化打印先上个例子...

给NAS测评打个样:QNAP TS-251D双盘位NAS全面测评体验

这两年随着大家网络条件越来越好,视频、电影资源越来越丰富。以及智能手机的普及拍照也更加方便,大家对于存储的需求也越来越高。除了传统的优盘、移动硬盘之外现在私有云方面也有了更多的选择。那么日常私有云选购...

取消回复欢迎 发表评论: