Docker 部署高性能抖音 TikTok数据爬取工具,支持无水印视频下载
nanshan 2025-07-06 15:24 6 浏览 0 评论
一、项目简介
此项目基于 PyWebIO、FastAPI 和 HTTPX,是一个高效的异步数据爬取工具,专注于抖音/TikTok平台的数据提取。通过Web端界面,用户可以在线批量解析并下载无水印的视频或图集。此外,本项目还提供了数据爬取API和iOS快捷指令,用于无水印内容的下载。您可以选择自行部署或对本项目进行改造,以实现更多功能。在您的项目中,可以直接调用 `scraper.py` 文件,或者通过现有的pip包安装,将其作为解析库来轻松获取数据。
支持功能:
- 网页端批量解析(支持抖音/TikTok混合解析)
- 在线下载视频或图集。
- 制作pip包方便快速导入你的项目
- iOS快捷指令快速调用API实现应用内下载无水印视频/图集
- 完善的API文档(Demo/演示)
- 丰富的API接口:抖音网页版API(视频解析、用户信息、用户视频图片、直播流等),TikTok网页版API(视频解析、用户信息、用户视频图片、直播流等)、哔哩哔哩网页版API(单个视频详细信息、视频流地址、用户视频作品等)
二、安装准备
2.1、Docker 安装
确保当前服务器安装了 Docker,如果没有可以自行安装,也可以直接部署。
# docker 信息
docker info
2.2、Cookie 获取(以抖音为例)
登陆网页版抖音,然后随便进入一个用户的主页,按 F12 打开开发者工具。按照下面步骤:选择 Network -> Fetch/XHR -> 刷新页面 -> 点击 post/? 接口 -> 复制 Cookie 所有的值(有用!)。如下图:
三、Docker 部署
3.1、修改Cookie
因为 douyin 风控的原因,需要替换成自己的 Cookie(而且在cookie失效时需要替换)
# 拉取代码
git clone https://github.com/Evil0ctal/Douyin_TikTok_Download_API.git
# 修改cookie 以抖音为例 (tiktok 目录在 crawler/tiktok )
cd Douyin_TikTok_Download_API/crawlers/douyin/web/
# 编辑 config.yaml
vim config.yaml
# 替换cookie,这个参数后面的替换成刚才获取到的cookie
Cookie: __ac_nonce=06629f03b000ca74fd5d0........
3.2、构建镜像
你可以选择使用 DockerHub 中构建好的镜像,也可以自己构建(推荐,因为要修改配置中的抖音cookie)
# 构建镜像(先安装docker 和 修改Cookie)
docker build -t douyin-tiktok-api:latest .
# 拉取官方镜像
docker pull evil0ctal/douyin_tiktok_download_api:latest
注:如官方镜像拉取失败,请查看这篇文章:国内docker镜像无法访问,通过cloudflare白嫖个人docker镜像加速
3.3、运行容器
# 自己构建的镜像
docker run -itd -p 80:80 --name douyin-tiktok-api --restart=always -v /etc/localtime:/etc/localtime:ro douyin-tiktok-api:latest
# 官方镜像
docker run -itd -p 80:80 --name douyin-tiktok-api --restart=always -v /etc/localtime:/etc/localtime:ro evil0ctal/douyin_tiktok_download_api:latest
3.4、验证容器
- 容器运行检查
docker ps
- 访问地址
# localhost 替换成当前服务器地址
http://localhost:80
# api文档界面
http://localhost:80/docs
3.5、停止和删除容器
# Stop
docker stop douyin-tiktok-api
# Remove
docker rm douyin-tiktok-api
四、Linux 部署
4.1、部署脚本
# 脚本是在Ubuntu 20.04 LTS上测试的,其他系统可能会有问题,如果有问题请自行解决。
wget -O install.sh https://raw.githubusercontent.com/Evil0ctal/Douyin_TikTok_Download_API/main/bash/install.sh && sudo bash install.sh
4.2、启停命令
# 启动
systemctl start Douyin_TikTok_Download_API.service
# 停止
systemctl stop Douyin_TikTok_Download_API.service
4.3、开机自启
# 添加开机自启
systemctl enable Douyin_TikTok_Download_API.service
# 删除开机自启
systemctl disable Douyin_TikTok_Download_API.service
4.4、更新项目
cd /www/wwwroot/Douyin_TikTok_Download_API/bash && sudo bash update.sh
五、测试截图
- 抖音用户信息
- 用户主页视频数据
- 单个视频详情
六、项目地址
- 开源地址
https://github.com/Evil0ctal/Douyin_TikTok_Download_API
- web端体验地址
https://douyin.wtf
- 文档地址
https://douyin.wtf/docs
相关推荐
- 爆肝 30 天!从 JVM 调优到百万级 QPS,我的 Java 性能飞升全记录(2)
-
前言:从崩溃边缘到百万级QPS的逆袭凌晨3点的办公室,监控大屏突然飙红,QPS从5万断崖式下跌到800,CPU满载报警,GC时间突破3秒大关——这是我们的电商大促系统在压测中遭...
- 如何彻底清除服务器上的恶意软件与后门 ?
-
当服务器遭受入侵后,清除恶意软件和后门是恢复系统安全性的关键步骤。如果清除不彻底,攻击者可能通过隐藏后门程序再次发动攻击。以下是一个系统化的操作指南,帮助您彻底清除服务器上的恶意软件和后门,同时加强服...
- Docker 部署高性能抖音 TikTok数据爬取工具,支持无水印视频下载
-
一、项目简介此项目基于PyWebIO、FastAPI和HTTPX,是一个高效的异步数据爬取工具,专注于抖音/TikTok平台的数据提取。通过Web端界面,用户可以在线批量解析并下载无水印的视频或...
- 我如何将Unix时间转换为可读的值?
-
高频处理时间问题在处理时间值时,程序中的一种常见方法是将其转换为线性刻度表示。无法将"2005年1月17日下午5:37"这样的日期存储为变量,并期望能够进行任何操作。因此,在合格的程序...
- 用shell进行ASCII字符转换与URL编码技巧
-
如何将ASCII字符转换为十进制(或十六进制)值并进行相反的转换?如何进行URL编码和URL解码?如果你在编写脚本时已知八进制或十六进制值,你可以使用printf命令实现:#POSIXprintf...
- Linux远程shell登录出现bash-4.2#问题
-
出现以上问题的原因是/root目录下丢失了.bashrc和.bash_profile文件/etc/skel/.bash_profile和/etc/skel/.bashrc的文件复制到/root下即可命...
- 三部门:推进算力互联互通 推动国家枢纽节点和需求地之间400G/800G 高带宽全光连接
-
每经AI快讯,1月6日,国家发展改革委等三部门印发《国家数据基础设施建设指引》。其中提出,加强新兴网络技术创新应用,优化网络计费方式,降低东西部数据传输成本,促进东部中高时延业务向西部转移。推进算力互...
- 三部门:推动国家枢纽节点和需求地之间400G/800G高带宽全光连接
-
国家发展改革委、国家数据局、工业和信息化部等印发《国家数据基础设施建设指引》的通知。其中提到,加强新兴网络技术创新应用,优化网络计费方式,降低东西部数据传输成本,促进东部中高时延业务向西部转移。推进算...
- 高带宽低延迟如何开启?实际效果如何?
-
在上次的《实测AMD平台玩游戏用什么频率的内存更好?》中通过测试已经得知,AMDCPU的最佳频率是6000,具体该如何选择,如何设置能提升游戏帧数,往下看小白新手也能看明白。内存选择6000频率内存...
- 排列五第22237期规律预测走势图分享
-
二定头尾:03458,X,X,035890XX00XX30XX50XX80XX93XX03XX33XX53XX83XX94XX04XX34XX54XX84XX95...
- 格式化字符串漏洞及利用_萌新食用
-
前言格式化字符串漏洞具有任意地址读,任意地址写。printfprintf--一个参数:情况1当参数只有1个字符串的话(含有%?),//?即i,x,s等等<br>第一个...
- Linux配置ip地址的两种方法(linux配置ip详细步骤)
-
Linux配置ip地址的两种方法,实验环境为centos7.6方法1:nmcli工具配置(centos7以下版本不支持该方法)第一步,通过nmcliconnection查看网卡名称[root@lo...
- 排列五9月30日第22263期最新规律走势预测讲解
-
二定头尾:034589,X,X,0125670XX00XX10XX20XX50XX60XX73XX03XX13XX23XX53XX63XX74XX04XX14XX2...
- GDB调试的高级技巧(gdb调试工具的使用)
-
GDB是我们平时调试c/c++程序的利器,查起复杂的bug问题,比打印大法要好得多,但是也不得不说,gdb在默认情况下用起来并不是很好用,最近学习到几个高级点的技巧,分享下:一美化打印先上个例子...
- 给NAS测评打个样:QNAP TS-251D双盘位NAS全面测评体验
-
这两年随着大家网络条件越来越好,视频、电影资源越来越丰富。以及智能手机的普及拍照也更加方便,大家对于存储的需求也越来越高。除了传统的优盘、移动硬盘之外现在私有云方面也有了更多的选择。那么日常私有云选购...
你 发表评论:
欢迎- 一周热门
-
-
极空间如何无损移机,新Z4 Pro又有哪些升级?极空间Z4 Pro深度体验
-
UOS服务器操作系统防火墙设置(uos20关闭防火墙)
-
如何修复用户配置文件服务在 WINDOWS 上登录失败的问题
-
手机如何设置与显示准确时间的详细指南
-
如何在安装前及安装后修改黑群晖的Mac地址和Sn系列号
-
日本海上自卫队的军衔制度(日本海上自卫队的军衔制度是什么)
-
爱折腾的特斯拉车主必看!手把手教你TESLAMATE的备份和恢复
-
10个免费文件中转服务站,分享文件简单方便,你知道几个?
-
FANUC 0i-TF数据备份方法(fanuc系统备份教程)
-
NAS:DS video/DS file/DS photo等群晖移动端APP远程访问的教程
-
- 最近发表
- 标签列表
-
- linux 查询端口号 (58)
- docker映射容器目录到宿主机 (66)
- 杀端口 (60)
- yum更换阿里源 (62)
- internet explorer 增强的安全配置已启用 (65)
- linux自动挂载 (56)
- 禁用selinux (55)
- sysv-rc-conf (69)
- ubuntu防火墙状态查看 (64)
- windows server 2022激活密钥 (56)
- 无法与服务器建立安全连接是什么意思 (74)
- 443/80端口被占用怎么解决 (56)
- ping无法访问目标主机怎么解决 (58)
- fdatasync (59)
- 405 not allowed (56)
- 免备案虚拟主机zxhost (55)
- linux根据pid查看进程 (60)
- dhcp工具 (62)
- mysql 1045 (57)
- 宝塔远程工具 (56)
- ssh服务器拒绝了密码 请再试一次 (56)
- ubuntu卸载docker (56)
- linux查看nginx状态 (63)
- tomcat 乱码 (76)
- 2008r2激活序列号 (65)