抖音无水印解析源码分享及原理浅谈

一只小彤刚 (UID: 5456) [复制链接]
帖子链接已复制到剪贴板
帖子已经有人评论啦,不支持删除!

838 1

抖音解析做了很久了,近段时间,抖音官方经常改算法。。。

最初是抓取的抖音网页端数据,只是这欠R的抖音在网页端搞了人机验证,抓不到数据了。

后面又尝试抓取抖音网页的请求元数据,找到了那个包含元数据的JS文件,只是有一个请求所需的参数没找到。无奈放弃,有空再研究。。。

那就只能抓移动端了,虽然包含的内容少,清晰度也没网页的高,但是好在还能用(没准哪天也来个验证啥的),那就凑合用吧。

源码特点:无需cookie,原生php支持,无需安装任何php扩展(包括cURL)

请求方式为:POST(个人喜欢用POST,至于为什么,经常做小程序API开发的应该都懂

请求参数为:[url : 抖音分享链接]

输出格式为:JSON

完整源码如下:(源码已做注释,请自行理解源码思路,我懒得写

<?php
/*
名称:抖音无水印解析脚本
源码作者:赵彤刚
测试环境:PHP 8.4
源码版本:v2.7.0
开源协议:Apache 2.0
最后更新:2025年1月6日
*/

// 拦截非POST请求
if ($_SERVER['REQUEST_METHOD'] != 'POST') {
    header('Location: https://blog.heheda.top');
    exit;
}
// 响应头
header("Content-type: application/json; charset=utf-8");
header("Access-Control-Allow-Origin: *");
header("X-Powered-By: PHP/" . PHP_VERSION);
header("Content-language: zh");
// 伪造请求头
$uavalue = "Mozilla/5.0 (Linux; Android 10; K) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/133.0.0.0 Mobile Safari/537.36";
$headers = [
    "Content-Type: application/x-www-form-urlencoded",
    "User-Agent: " . $uavalue,
    "Accept-language: zh-CN,zh;q=0.9,de;q=0.8,ug;q=0.7",
    "Referer: https://www.douyin.com/?is_from_mobile_home=1&recommend=1"
];
// 获取POST输入
$url = urldecode($_POST['url']);
// 判断是否为数字
if (is_numeric($url)) {
    $video_id = $url;
} else {
    preg_match('/https?:\/\/[^\s]+/', $url, $video_url);
    $video_url = $video_url[0];
    $redirected_url = get_redirected_url($video_url);
    preg_match('/(\d+)/', $redirected_url, $matches);
    $video_id = $matches[1];
}
// 获取数据
$adder = "https://www.iesdouyin.com/share/video/" . $video_id . "/";
$context = stream_context_create([
    'http' => [
        'method' => 'GET',
        'header' => $headers,
    ]
]);
$response = file_get_contents($adder, false, $context);
preg_match('/_ROUTER_DATA\s*=\s*(\{.*?\});/', $response, $matches);
$data = $matches[1];
// 解析JSON数据
$jsonData = json_decode($data, true);
// 筛选信息
$itemList = $jsonData['loaderData']['video_(id)/page']['videoInfoRes']['item_list'][0];
$nickname = $itemList['author'];
$video = $itemList['video']['play_addr']['uri'];
$images = $itemList['images'] ?? null;
// 构造输出
$outData = [
    'code' => empty($nickname) ? 0 : 1,
    'msg' => empty($nickname) ? '解析失败!' : '解析成功!️',
    'name' => $nickname['nickname'],
    'title' => $itemList['desc'],
    'aweme_id' => $itemList['aweme_id'],
    'video' => $video !== null ? (strpos($video, 'mp3') === false ? 'https://www.douyin.com/aweme/v1/play/?video_id=' . $video : $video) : null,
    'cover' => $itemList['video']['cover']['url_list'][0],
    'images' => array_map(function ($image) {
        return $image['url_list'];
    }, is_array($images) ? $images : []),
    'type' => empty($images) ? '视频' : '图集'
];
// 输出
echo json_encode($outData);
// 重定向方法
function get_redirected_url($url)
{
    // 赋予全局变量
    global $headers, $uavalue;
    // 环境配置
    ini_set("user_agent", $uavalue);
    $context = stream_context_create([
        'http' => [
            'method' => 'GET',
            // 启用重定向
            'follow_location' => 1,
            // 最大重定向次数
            'max_redirects' => 5,
            'header' => $headers,
        ],
    ]);
    $response = file_get_contents($url, false, $context);
    foreach ($http_response_header as $header) {
        if (strpos($header, 'Location:') === 0) {
            return trim(substr($header, 9));
        }
    }
    return $url;
}

如果自己不想(不会)搭建的,也可以直接用我搭建好的。

地址:https://php-api.heheda.top/jiexi/douyin/

【请求方式和请求参数同上】

PS:稳定版接口已下线,并且后期不在提供稳定接口,此接口仅供测试,看心情维护,不保证稳定性。

 

如果有更好的实现思路或方法,欢迎大神前来交流!

这家伙太懒了,什么也没留下。
已有评论 ( 1 )
提示:您必须 登录 才能查看此内容。
创建新帖
自助推广点击空位自助购买TG联系
确认删除
确定要删除这篇帖子吗?删除后将无法恢复。
删除成功
帖子已成功删除,页面将自动刷新。
删除失败
删除帖子时发生错误,请稍后再试。