我正在处理一个具有下面表格结构的数据集。我已经开发了不同的查询,到目前为止已经成功了。然而,有两个问题困扰着我,我想知道你们是否能指出我做错了什么。
1:需要提取在项目'abc‘上创建最多更改数量的前10个AuthorAccountId。
例如,返回在项目'abc‘上创建了最多更改次数的前10个AuthorAccountId。查询必须返回两列: authorId和每个作者所做的更改次数。
以下是我开发的查询,但没有给出想要的结果。
SELECT ch_authoraccountid,count(ch_project)
FROM t_change
WHERE ch_project LIKE 'abc'
ORDER BY ch_authoraccountId DESC
LIMIT 102:返回2017年内未提交变更的作者姓名(本例为t_change上的子查询)。
例如,预期结果应返回2017年未发生任何变化的作者的姓名。
以下是查询
SELECT p_name
FROM t_people
WHERE p_accountid IN (SELECT ch_createdTime
FROM t_change
WHERE ch_createdTime != '2016-01-01')")参考: Yang,R.G.Kula,N. Yoshida和H. Iida,“挖掘现代代码审查存储库:人员,流程和产品的数据集”,2016IEEE/ACM第13届挖矿SoftwareRepositories工作会议,德克萨斯州奥斯汀,2016,第460-463。
https://github.com/kin-y/miningReviewRepo/wiki/Database-Schema

发布于 2019-03-11 06:08:28
对于第一个查询,尝试如下所示:
SELECT ch_authoraccountid, COUNT(ch_project)
FROM t_change
WHERE ch_project = 'abc'
GROUP BY ch_authoraccountid
ORDER BY COUNT(ch_project) DESC
LIMIT 10它将统计每个授权帐户It在'abc‘项目中的更改次数。
对于第二个:
SELECT p_name
FROM t_people
WHERE p_accountid NOT IN (SELECT ch_authorAccountId
FROM t_change
WHERE ch_createdTime BETWEEN '20170101' AND '20171231')")https://stackoverflow.com/questions/55092743
复制相似问题