一【题目描述】
标题:日志统计
小明维护着一个程序员论坛。现在他收集了一份"点赞"日志,日志共有N行。其中每一行的格式是:
ts id
表示在ts时刻编号id的帖子收到一个"赞"。
现在小明想统计有哪些帖子曾经是"热帖"。如果一个帖子曾在任意一个长度为D的时间段内收到不少于K个赞,小明就认为这个帖子曾是"热帖"。
具体来说,如果存在某个时刻T满足该帖在[T, T+D)这段时间内(注意是左闭右开区间)收到不少于K个赞,该帖就曾是"热帖"。
给定日志,请你帮助小明统计出所有曾是"热帖"的帖子编号。
【输入格式】
第一行包含三个整数N、D和K。
以下N行每行一条日志,包含两个整数ts和id。
对于50%的数据,1 <= K <= N <= 1000
对于100%的数据,1 <= K <= N <= 100000 0 <= ts <= 100000 0 <= id <= 100000
【输出格式】
按从小到大的顺序输出热帖id。每个id一行。
【输入样例】
7 10 2
0 1
0 10
10 10
10 1
9 1
100 3
100 3
【输出样例】
1
3
资源约定:
峰值内存消耗(含虚拟机) < 256M
CPU消耗 < 1000ms
请严格按要求输出,不要画蛇添足地打印类似:“请您输入...” 的多余内容。
注意:
main函数需要返回0;
只使用ANSI C/ANSI C++ 标准;
不要调用依赖于编译环境或操作系统的特殊函数。
所有依赖的函数必须明确地在源文件中 #include <xxx>
不能通过工程设置而省略常用头文件。
提交程序时,注意选择所期望的语言类型和编译器类型。
二【解题思路】
看到这个题目,首先的想法就是首先得到一个id的数组,然后二维数据对每个id的时间t进行排序,之后从最左端开始查找,点赞数大于等于k,如果区间不小于D,那么端点向右移一位(有点类似于BF算法KMP算法,这里用到的是尺寸法,可以看这个博主的介绍https://blog.csdn.net/lxt_Lucia/article/details/81091597)。如果是这样,那么时间复杂度和空间复杂度可能就很大了,所以除了不重复的容器set外(可看https://blog.csdn.net/sinat_37158899/article/details/79328101),还要知道vector数组查找更加的简单(这个大佬有详解https://www.cnblogs.com/yskn/p/9053161.html),于是就开始写代码吧。
三【解题步骤】
#include<bits/stdc++.h>
using namespace std;
#define N 1000005
vector<int> t[N];//vector数组,存储时间
set<int> s;//set数据类型,存储id
int n,d,k;
bool judge(int x)//判断此id是不是热帖
{
int len = t[x].size();
if(len<k)
return 0;
sort(t[x].begin(),t[x].end());
int l=0,r=0,sum=0;
while(l<=r&&r<len)
{
sum++;
if(sum>=k)
{
if(t[x][r]-t[x][l]<d)
return 1;
else
{
l++;//尺寸法,左端向前移动
sum--;
}
}
r++;//向后移动
}
return 0;
}
int main()
{
cin>>n>>d>>k;
for(int i=0;i<n;i++)
{
int ts,id;
cin>>ts>>id;
t[id].push_back(ts);
s.insert(id);
}
for(set<int>::iterator it=s.begin();it!=s.end();it++)//这里将set里面的数据拿出来,一一判断
//每次插入时set里面的iterator指针是有效的,这点与vector不同
{
int x = *it;
if(judge(x))
cout<<x<<endl;
}
return 0;
}
四【总结】
掌握STL还是很重要的,继续冲鸭!