首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >Instagram Story Scraper

Instagram Story Scraper
EN

Stack Overflow用户
提问于 2020-02-04 03:35:16
回答 2查看 1.7K关注 0票数 2

我做了一个小的Instagram故事刮板,但我不能让它工作…我可能只是太累了。我已经试过所有的方法了,但我自己解决不了这个问题

每次我用Wamp运行它时,我都会得到同样的错误

这是我的index.php文件

代码语言:javascript
复制
<?php
require_once('instagramStory.php');
$story = new instagram_story();
echo $story->getStory("garyvee");
?>

这是instagramStory.php

代码语言:javascript
复制
<?php
class instagram_story{
    protected function file_get_contents_curl($url){
        $cookies = dirname(__FILE__)."/cookie.txt" ;
        $curl = curl_init();
        curl_setopt ($curl, CURLOPT_URL, $url);
        curl_setopt ($curl, CURLOPT_FOLLOWLOCATION, 1);
        curl_setopt ($curl, CURLOPT_COOKIEFILE, $cookies);
        curl_setopt ($curl, CURLOPT_RETURNTRANSFER, true);
        $answer = curl_exec($curl);
        curl_close($curl);
        return $answer;
    }
    public function getStory($username){
        $url = file_get_contents("https://www.instagram.com/$username/");
        $json = '/sharedData\s=\s(.*[^\"]);<.script>/ixU';
        preg_match_all($json, $url, $jsondata, PREG_SET_ORDER, 0);
        $array = json_decode($jsondata[0][1], true);
        $user_id = $array['entry_data']['ProfilePage']['0']['graphql']['user']['id'];
        $stories = $this->file_get_contents_curl("https://www.instagram.com/graphql/query/?query_hash=de8017ee0a7c9c45ec4260733d81ea31&variables=%7B%22reel_ids%22%3A%5B%22$user_id%22%5D%2C%22tag_names%22%3A%5B%5D%2C%22location_ids%22%3A%5B%5D%2C%22highlight_reel_ids%22%3A%5B%5D%2C%22precomposed_overlay%22%3Afalse%2C%22show_story_viewer_list%22%3Atrue%2C%22story_viewer_fetch_count%22%3A50%2C%22story_viewer_cursor%22%3A%22%22%7D");
        $data = json_decode($stories, true);
        $stories = $data['data']['reels_media']['0']['items'];
        $_story = [];
        foreach ($stories as $story) {
            $vid = 'video_resources';
            if (!array_key_exists($vid, $story)) {
                $_story [] = $story['display_url'];
            } else {
                $_story [] = $story['video_resources'][0]['src'];
            }
        }
        foreach ($_story as $story) {
            $check = '/mp4/m';
            preg_match_all($check, $story, $matches, PREG_SET_ORDER, 0);
            if (empty($matches)) {
                echo "<a href=$story&dl=1><img src=$story></a>";
            } else {
                echo '<video width="320" height="240" controls>';
                echo '<source src="' . $story . '" type="video/mp4">';
                echo '</video>';
                echo "<a href=$story&dl=1>Download</a>";
            }
        }
    }
}
?>
EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2020-02-12 01:56:25

我正在和你检查同样的问题。很明显,这是因为'foreach‘命令正在访问一个空数组。

我深入检查了数据,发现$stories是空的,因为它无法接收来自instagram网站的最新数据。

当我尝试访问由程序在我自己的浏览器上创建的URL时,ins帐户已记录,它工作。

所以问题是因为代码$cookies = dirname(__FILE__)."/cookie.txt" ;找不到当前的cookies。您应该在登录instagram网站后复制.php文件,并将cookie.txt文件和cookie文件放在同一文件夹中。

票数 2
EN

Stack Overflow用户

发布于 2020-02-04 03:44:57

你得到这个错误是因为你试图遍历不是数组的东西。

所以在第22行,您将执行以下操作:

$stories = $data['data']['reels_media']['0']['items'];

这显然是不正确的。尝试使用var_dump($data);,看看会得到什么输出,然后从那里开始。如果你还在苦苦挣扎,那就发布var_dump的结果。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/60046010

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档