首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏python3

    Python调用API获取内容

    一:获取app-key 和 app-secret     使用自己的账号登录开放平台,在开放中心下“创建应用”创建一个应用,应用信息那些随便填,填写完毕后,不需要提交审核,需要的只是那个app-key 在“开放平台”的“管理中心”找到刚才创建的应用,点开这个应用,点开左边“应用信息”栏,会看见“App key”和“App Secret”的字样,这两个东西是要在后面程序中使用的。 三:安装 python SDK 有两种安装方式: 1:http://github.liaoxuefeng.com/sinaweibopy/下载新浪SDK 2:python有个简单的安装方式:直接在命令行下键入 code=2024222384d5dc88316d21675259d73a将code后面那个复制到控制端,程序需要读入2024222384d5dc88316d21675259d73a这个数据  注意:如果想获取别的信息 以下为我的关注用户的: ? ? ? ? 拿上边代码为例,这里我们获取的信息有: ?

    5.4K41发布于 2020-01-10
  • 来自专栏大数据

    爬虫

    全文简介 本文是用Python爬取移动端的数据。可以看一下Robots协议。另外尽量不要爬取太快。如果你毫无节制的去爬取别人数据,别人网站当然会反爬越来越严厉。 环境介绍 Python3 Windows-10-64位 移动端 网页分析 以获取评论信息为例(你可以以自己的喜好获得其他数据)。 id=4160547165300149&page=3 将网址在火狐里面打开如下图: 上面的网址其实pages=3就代表第三页,所以只需模拟网址即可,pages=4,5,6。。。。

    1.8K50发布于 2018-01-18
  • 来自专栏四楼没电梯

    新浪 OAuth2 NodeJs发

    想用nodejs写个博客户端发,无奈新浪的nodejs sdk是OAuth1.0的。 只能自己根据OAuth1.0 改了改。 ", passwd = "密码"; var baseurl = "https://api.weibo.com/2/"; var weibo = module.exports = function response_type'] = "code"; params['action'] = "submit"; params['userId'] = userId; // 帐号 //statuses/destroy 删除信息 //statuses/update 发布一条信息 //statuses/upload 上传图片并发布一条 //statuses /* args参数: * id : id * status : 转发文本 * is_comment 0-不发评论 1-发评论给当前 2-发评论给原

    74010编辑于 2024-10-12
  • 来自专栏老高的技术博客

    通过的mid获取的URL

    int10to62($int10) { static $str62keys; $str62keys = array("0","1","2","3","4","5"

    1.3K30编辑于 2022-12-24
  • 来自专栏坏男孩

    下饭:子域名跳转到腾讯

    下饭:子域名跳转到腾讯 如图所示: ? 新浪子域名 help.weibo.com 解析到 1.1.1.1 并且设置跳转 t.qq.com(腾讯)。 起因: 今天找回新浪密码时候访问到 help.weibo.com,结果是如下页面。 ? (发现时是不能访问的,至于跳转到腾讯,是后面help.weibo.com做了一些操作。) ? 为什么会这样? 当然最终的锅还是在上,(也许他的内网在用1.1.1.1?) 就等同于此人拥有了help.weibo.com的解析权,于是这位就带来了今天的下饭操作:跳转到腾讯。可能会找实习生背锅吧。 我们应该如何避免? 当然,这种行为是不恰当的。

    2.8K10发布于 2020-08-28
  • 来自专栏月小水长

    可视化网站新增位置栏目:收录 5w 条北京地标签到数据

    周末抽空补全了可视化网站上三大聚合之一的位置聚合栏目。 大概收录了北京这么些地点的数据。 , "北京植物园", "北京动物园", "元大都城垣遗址公园", "水立方", "鼓楼大街" 一共 49 个地名(笔者应该去过不到一半),5w 条打卡信息(近一个月);地名是我在北京地图上漫游手动摘录的,地图漫游地址如下: https://place.weibo.com/wandermap/? pcid=B2094654D36EA6FF459A&ext={%22lbsType%22:%22poi%22,%22lbsID%22:%22B2094654D26AA7FC419F%22} 近来改版 ,对地名相关搜索接口收窄了,不能够搜索非所在城市的地名了;所以之前的位置聚合爬虫已经失效了,需要稍作修改,不过由于种种限制,先静观其变,等待该接口稳定后再予以修正。

    1K20编辑于 2022-04-01
  • 来自专栏IT民工的代码世界

    Java网络爬虫抓取新浪个人记录

    接下来就是新浪的抓取,一般的http访问新浪网站得到的html都是很简略的,因为新浪主页是用js动态生成的并且要进过多次的http请求与验证才能访问成功,所以为了数据抓取的简便,我们走一个后门 ,也就是访问新浪的手机端,weibo.cn进行抓取,但随之而来的一个问题是,新浪的访问不管哪一端都需要强制的登陆验证,所以我们需要在http请求的时候附带一个cookie进行用户验证。 weibo.cn的cookie * @author hu */ public class WeiboCN { /** * 获取新浪的cookie,这个方法针对weibo.cn 有效,对weibo.com无效 * weibo.cn以明文形式传输数据,请使用小号 * @param username 新浪用户名 * @param password 5页进行爬取*/ for (int i = 1; i <= 5; i++) { crawler.addSeed(new CrawlDatum("http://weibo.cn

    1.3K40编辑于 2023-07-19
  • 来自专栏小蠢驴iOS专题

    Swift5 + MVVM + 文艺复兴(纯代码)

    熟练度不够的话,很多 Swift 的高级写法还得去翻文档才知道什么意思,所以就打算从0单排一个Swift的项目,而正好有 开放API , 所以这里就选择它了。 主页界面 ? image 项目功能 原创功能 转发功能 Emoji表情功能 撰写界面 新特性功能 消息提醒功能 多图展示功能 富文本功能 多图展示功能 下滑自动加载功能 上/下拉刷新功能 不足点 Weibo 的 App 包里的素材图片实在太多了,找到完全匹配的要花费超多时间,所以有的资源不是很匹配,或者不是当前最新的 该Demo使用了FMDB,其实这种时效性毕竟高,且有较高政治敏感度的 这个文艺复兴版的(2016年的),现在的已经有了较大的变动,且很多API接口现在已经不开放了,所以暂时先用此怀旧版本. Gif图片由于现在门户网站只能传 < 5M 的,所以看上去毕竟模糊,实际效果会比 Gif 图片好得多,建议用真机跑一下试试~ 这版本来打算用本人拙劣的英文写全篇的注释,后来由于本人 Chinelish

    1.3K20发布于 2020-04-30
  • 来自专栏用户画像

    订阅评论

    参考:http://open.weibo.com/wiki/%E7%A4%BA%E4%BE%8B%E4%BB%A3%E7%A0%81 开放平台给出的代码有很多bug,在此纠正 如乱码问题的解决: String

    93321发布于 2018-08-24
  • 来自专栏前端之路

    –图床

    首先感谢新浪提供的免费图床(对外链无限制),以及吊炸天的cdn图片加速服务,从此妈妈再也不用担心我的图床不能用了 图床原理: 访问 http://weibo.com/minipublish 使用新浪账号登陆 进入到发的界面: ? 不需要发布,图片只要上传就会存在于图床中 实用图床推荐 新浪图床 - Chrome 网上应用店 围脖是个好图床 - Chrome 网上应用店 实用云图床推荐 https网页一建生产图床

    2.2K40发布于 2018-07-17
  • 来自专栏乱码李

    情绪分析

    使用node.js爬虫每天从「新浪」上爬取一定数量的。主要实现登录,抓取发布,抓取关注人和粉丝的功能,暂时把数据存放在MongoDB中。 weibo_crawler 第一部分是准备数据,随机爬取50w左右的用户,然后每天爬取他们前一天发布的作为本项目的数据源。 由于新浪对爬虫有限制,因此爬取用户的时候采用定时器的方式。 由于只有登录了才能获取某个用户的个人信息和关注粉丝信息,而爬虫的难点就在于用户登录。 对抓取失败的,Retry 5次 2. 放弃非人类 什么是非人类呢? 情感强度分为1,3,5,7,9五档,9表示强度最大,1为强度最小。

    1.8K10发布于 2021-11-26
  • 来自专栏苏生不惑

    再谈备份

    Octoman Octoman是个Chrome扩展 https://chrome.google.com/webstore/detail/octoman%E5%BE%AE%E5%8D%9A%E5%A4%87% h5 https://m.weibo.cn/ ,这个扩展也是基于h5接口来备份的。 除了备份,这个作者还有个Chrome扩展可以备份相册 https://chrome.google.com/webstore/detail/octo%E5%BE%AE%E5%8D%9A%E7% 9B%B8%E5%86%8C%E6%89%B9%E9%87%8F%E4%B8%8B%E8%BD%BD/cdimdlckbkfelaogjhfbkjcfncbpngkn 相册下载 进入微主页,这里选择王菲的 https://www.weibo.com/u/1629810574 ,天后已经5年不更新了, 点击扩展图标,点击需要下载的相册 。

    2K31发布于 2020-07-21
  • 来自专栏刘晓杰

    新浪SDKdemo

    最近几天做了一下新浪的sdkdemo。其实也就是把管网上给的demo下下来运行一下。顺便看了一些bug。 首先要了解Oauth2.0授权认证,和SSO 登录功能。 Constants.java 问题: 1.通过Code获取Token部分,WeiboAuth这个类根本没有封装在里面,导致无法响应AuthListener,功能失效 2.短信验证只能3次,3次以后就不能用了 ------分享 openapi.WBUserAPIActivity" />------获取<1>用户昵称<2>用户信息(粉丝数) <activity android:name=".openapi.WBStatusAPIActivity" />------获取状态 <activity android:name=".openapi.WBCommentAPIActivity" />------获取某条的评论列表 <activity android:name=".

    1.8K30发布于 2019-02-21
  • 来自专栏前端之路

    图床

    首先感谢新浪提供的免费图床(对外链无限制),以及吊炸天的cdn图片加速服务,从此妈妈再也不用担心我的图床不能用了 图床原理: 访问 http://weibo.com/minipublish 使用新浪账号登陆 进入到发的界面: ? 不需要发布,图片只要上传就会存在于图床中 实用图床推荐 新浪图床 - Chrome 网上应用店 围脖是个好图床 - Chrome 网上应用店 实用云图床推荐 https网页一建生产图床

    5.1K20发布于 2018-07-17
  • 来自专栏机器学习AI算法工程

    python模拟新浪登陆功能(新浪爬虫)

    (Python) PC 登录新浪时, 在客户端用js预先对用户名、密码都进行了加密, 而且在POST之前会GET 一组参数,这也将作为POST_DATA 的一部分。 由于要用的一部分数据用API获取不方便, 所以还是要自己写个小爬虫, 模拟登录是必不可少的。琢磨了一下这个东西,最终登录成功。 接下来再请求这个URL,这样就成功登录到了。 记得要提前build 缓存。 下面是完整代码(没加注释,凑合看吧): #! 很多豆友反馈有模拟登录新浪抓取数据的需求,其实对于一般的数据获取,如用户信息、内容等,使用开放平台API是更明智的选择:速度更快,而且节省许多网页处理的功夫。 熟悉Web的朋友只要定期维护模拟登录的代码就可以一直成功登录。如果不那么熟悉的话,其实可以采用更naive的思路来解决:直接将Cookie发送给新浪以实现模拟登录。

    3.7K60发布于 2018-03-13
  • 来自专栏机器学习AI算法工程

    中的用户画像:中的用户模型

    经历了6年的发展,已经成为了国内社交媒体的中坚力量。本文从的角度出发,对中用户模型的目的、维度和建模任务进行描述,并作为后续用户模型相关文章的总述。 从自身的角度来讲,构建用户模型的目的包括: (1) 完善及扩充用户信息 用户模型的首要动机就是了解用户,这样才能够提供更优质的服务。 (5) 识别关系圈:从关系图谱的本身的结构出发,从中发掘关联紧密的群体,有助于信息的精准投放和推广。 接下来主要介绍一下画像中兴趣维度的构建方法。 2. 用户兴趣分析 (1) 标签来源 用户自标签、达人或认证标签、公司、学校、群标签、星座、关键词……这些来源都可能成为用户的标签。 小结 用户画像的目的是将用户信息标签化,本文中介绍针对本身的特点介绍用户画像的构建,该用户画像主要还是从的业务出发,完善用户信息和发掘用户兴趣,区分兴趣和能力,并形式化结构化表达出来。

    5.1K100发布于 2018-03-13
  • 来自专栏全栈程序员必看

    新浪模仿的是_随便看看在哪

    ; weibolist.add(webo4); weibo webo5=new weibo("我在幸福后面",R.drawable.p5,"一朵花的凋零,荒芜不了整个春天,一次挫折也荒废不了整个人生。" ; weibolist.add(webo5); weibo webo6=new weibo("等",R.drawable.p6,"挫折是一块石头,对于弱者来说它是拌脚石,让你停步不前。 android:layout_width="match_parent" android:layout_height="wrap_content" > </ListView> </LinearLayout> 5.

    73020编辑于 2022-11-17
  • 来自专栏JAVA高级架构

    新浪王传鹏:推荐架构的演进

    两个核心基础点:一是用户关系构建,二是内容传播,推荐一直致力于优化这两点,促进发展。如图1所示: ? 为了便于理解推荐架构演进,在介绍之前需要陈述一下推荐在流程上的构成,其实这个和本身没有关系,理论上业内推荐所存在的流程基本都是相同的。 当时的外部环境因素包括: 1) 项目需求很多,在当时一个5人团队并行开发的项目平均在3-5个左右,当然最重要的因素是当时的产品正处于高速发展期,很多地方都需要推荐的支撑。 2) 架构组成 推荐2.0的架构如图5所示,它不再是一个个独立的系统,也不是会让开发人员使用不同的技术解决相似的问题。 图5 推荐2.0架构示意图 计算层:主要承担推荐的排序计算,主要消耗CPU,在这一层给算法提供介入方法,支持算法的模型迭代。

    2.3K20发布于 2018-09-29
  • 来自专栏小轻论坛

    清明前夕,上线“仅半年内可见”功能

    4月4日消息,今日晚间管理员发消息称,为了增强用户对自己账号内容的自主性和处理能力,站方新增了“仅半年内可见”的用户功能。 ? 据悉,用户开启该设置后,发布时间超过6个月的将被设置为“仅主可见”,其他用户无法查看。该设置在信息流、个人主页、搜索场景生效。 设置入口如下并见图: 打开博客户端-我-隐私设置-可见时间范围中,勾选最近半年选项即可成功设置。 如何恢复成内容全部可见: 在博客户端-我-隐私设置-可见时间范围中,勾选全部,即可变为全部内容对用户可见。 ? ? ?

    77310发布于 2019-04-25
  • 来自专栏全栈程序员必看

    账号注册_不用手机号注册小号

    新浪开放平台:https://open.weibo.com/ 1.注册账号 注册新浪账号 进入首页。

    3.6K40编辑于 2022-09-20
领券