给定一位研究者论文被引用次数的数组(被引用次数是非负整数),数组已经按照升序排列。编写一个方法,计算出研究者的 h 指数。
h 指数的定义: “h 代表“高引用次数”(high citations),一名科研人员的 h 指数是指他(她)的 (N 篇论文中)至多有 h 篇论文分别被引用了至少 h 次。(其余的 N - h 篇论文每篇被引用次数不多于 h 次。)"
示例:
输入:citations = [0,1,3,5,6]
输出: 3 解释: 给定数组表示研究者总共有5
篇论文,每篇论文相应的被引用了 0, 1, 3, 5, 6
次。 由于研究者有3
篇论文每篇至少被引用了3
次,其余两篇论文每篇被引用不多于3
次,所以她的 h 指数是3
。
说明:
如果 h 有多有种可能的值 ,h 指数是其中最大的那个。
进阶:
- 这是 H指数 的延伸题目,本题中的
citations
数组是保证有序的。 - 你可以优化你的算法到对数时间复杂度吗?
思路:
二分查找。
根据题意:找的是某个点,满足这个点的值 > = 它和它右侧的点个数之和cnt情况下,cnt就是当前的h指数
如果已经有h指数了,就可以试着往左找,因为越左cnt越大,h指数也越大,所以左侧可能存在更大的h值,
如果目前还没有h指数,就只能试着缩小cnt,往右找,
此题缩小搜索范围的思路就可以用二分查找来实现。
class Solution(object):
def hIndex(self, citations):
"""
:type citations: List[int]
:rtype: int
"""
l = len(citations)
lo, hi = 0, l - 1
res = 0
while(lo <= hi):
mid = lo + (hi - lo) // 2
cnt = l - mid #包括mid自身右边还有的元素个数
if citations[mid] >= cnt:
res = cnt
hi = mid -1
else:
lo = mid + 1
return res