Linux之Poll机制理解

​这是我参与11月更文挑战的第13天,活动详情查看:2021最后一次更文挑战

最近看了一下Linux Poll 机制的实现,看了韦老师的分析文档,总结如下:

int poll(struct pollfd *fds,nfds_t nfds, int timeout);

总的来说,Poll机制会判断fds中的文件是否可读,如果可读则会立即返回,返回的值就是可读fd的数量,如果不可读,那么就进程就会休眠timeout这么长的时间,然后再来判断是否有文件可读,如果有,返回fd的数量,如果没有,则返回0.  

Linux内核实现过程

在内核中大致上实现过程:

当应用程序调用poll函数的时候,会调用到系统调用sys_poll函数,该函数最终调用do_poll函数,do_poll函数中有一个死循环,在里面又会利用do_pollfd函数去调用驱动中的poll函数(fds中每个成员的字符驱动程序都会被扫描到),驱动程序中的Poll函数的工作有两个,一个就是调用poll_wait 函数,把进程挂到等待队列中去(这个是必须的,你要睡眠,必须要在一个等待队列上面,否则到哪里去唤醒你呢。另一个是确定相关的fd是否有内容可 读,如果可读,就返回1,否则返回0,如果返回1 ,do_poll函数中的count++, 然后  do_poll函数然后判断三个条件(if (count ||!timeout || signal_pending(current)))如果成立就直接跳出,如果不成立,就睡眠timeout个jiffes这么长的时间(调用schedule_timeout实现睡眠),如果在这段时间内没有其他进程去唤醒它,那么第二次执行判断的时候就会跳出死循环。如果在这段时间内有其他进程唤醒它,那么也可以跳出死循环返回(例如我们可以利用中断处理函数去唤醒它,这样的话一有数据可读,就可以让它立即返回)。

poll机制分析

所有的系统调用,基于都可以在它的名字前加上“sys_”前缀,这就是它在内核中对应的函数。比如系统调用open、read、write、poll,与之对应的内核函数为:sys_open、sys_read、sys_write、sys_poll。

内核框架

对于系统调用poll或select,它们对应的内核函数都是sys_poll。分析sys_poll,即可理解poll机制。

1.      sys_poll函数位于fs/select.c文件中,代码如下:

asmlinkagelong sys_poll(struct pollfd __user *ufds, unsigned int nfds,

                 long timeout_msecs)

{

         s64 timeout_jiffies;




         if (timeout_msecs > 0) {

#ifHZ > 1000

             /* We can only overflow if HZ >1000 */

             if (timeout_msecs / 1000 >(s64)0x7fffffffffffffffULL / (s64)HZ)

                 timeout_jiffies = -1;

             else

#endif

                 timeout_jiffies =msecs_to_jiffies(timeout_msecs);

         } else {

             /* Infinite (< 0) or no (0)timeout */

             timeout_jiffies = timeout_msecs;

         }




         return do_sys_poll(ufds,nfds, &timeout_jiffies);

}
复制代码

它对超时参数稍作处理后,直接调用do_sys_poll。

2.      do_sys_poll函数也位于位于fs/select.c文件中,我们忽略其他代码:

intdo_sys_poll(struct pollfd __user *ufds, unsigned int nfds, s64 *timeout)

{

……

poll_initwait(&table);

……

         fdcount = do_poll(nfds, head,&table, timeout);

……

}

复制代码

poll_initwait函数非常简单,它初始化一个poll_wqueues变量table:

poll_initwait> init_poll_funcptr(&pwq->pt, __pollwait); > pt->qproc = qproc;

即table->pt->qproc= __pollwait,__pollwait将在驱动的poll函数里用到。

3.      do_sys_poll函数位于fs/select.c文件中,代码如下:

static int do_poll(unsigned int nfds,  struct poll_list *list,

            struct poll_wqueues *wait, s64 *timeout)

{

 ……

   for (;;){

 ……

                   if(do_pollfd(pfd, pt)) {

                           count++;

                           pt = NULL;

                   }

 ……

       if(count || !*timeout || signal_pending(current))

           break;

       count= wait->error;

       if(count)

           break;



       if(*timeout < 0) {

           /*Wait indefinitely */

           __timeout= MAX_SCHEDULE_TIMEOUT;

       }else if (unlikely(*timeout >= (s64)MAX_SCHEDULE_TIMEOUT-1)) {

           /*

           * Wait for longer than MAX_SCHEDULE_TIMEOUT. Do it in

           * a loop

           */

           __timeout= MAX_SCHEDULE_TIMEOUT - 1;

           *timeout-= __timeout;

       }else {

           __timeout= *timeout; 
           *timeout= 0;

       }



       __timeout= schedule_timeout(__timeout); // 休眠时间由应用提供

       if(*timeout >= 0)

           *timeout+= __timeout;

   }

   __set_current_state(TASK_RUNNING);

   returncount;

 }

复制代码

分析其中的代码,可以发现,它的作用如下:

①    从02行可以知道,这是个循环,它退出的条件为:

a.      09行的3个条件之一(count非0,超时、有信号等待处理)

count顺0表示04行的do_pollfd至少有一个成功。

b.      11、12行:发生错误

②    重点在do_pollfd函数,后面再分析

③    第30行,让本进程休眠一段时间,注意:应用程序执行poll调用后,如果①②的条件不满足,进程就会进入休眠。那么,谁唤醒呢?除了休眠到指定时间被系统唤醒外,还可以被驱动程序唤醒──记住这点,这就是为什么驱动的poll里要调用poll_wait的原因,后面分析。

4.      do_pollfd函数位于fs/select.c文件中,代码如下:

static inline unsigned int do_pollfd(struct pollfd*pollfd, poll_table *pwait)

{

……

             if(file->f_op && file->f_op->poll)

                     mask= file->f_op->poll(file, pwait);

……

}

复制代码

可见,它就是调用我们的驱动程序里注册的poll函数。

驱动程序

驱动程序里与poll相关的地方有两处:一是构造file_operation结构时,要定义自己的poll函数。二是通过poll_wait来调用上面说到的__pollwait函数,pollwait的代码如下:

staticinline void poll_wait(struct file * filp, wait_queue_head_t * wait_address,poll_table *p)

{

         if (p && wait_address)

             p->qproc(filp, wait_address, p);

}
复制代码

p->qproc就是__pollwait函数,从它的代码可知,它只是把当前进程挂入我们驱动程序里定义的一个队列里而已。它的代码如下:

staticvoid __pollwait(struct file *filp, wait_queue_head_t *wait_address,

                         poll_table *p)

{

         struct poll_table_entry *entry =poll_get_entry(p);

         if (!entry)

             return;

         get_file(filp);

         entry->filp = filp;

         entry->wait_address = wait_address;

         init_waitqueue_entry(&entry->wait,current);

         add_wait_queue(wait_address,&entry->wait);

}

复制代码

执行到驱动程序的poll_wait函数时,进程并没有休眠,我们的驱动程序里实现的poll函数是不会引起休眠的。让进程进入休眠,是前面分析的do_sys_poll函数的30行“__timeout = schedule_timeout(__timeout)”。

poll_wait只是把本进程挂入某个队列,应用程序调用poll > sys_poll> do_sys_poll > poll_initwait,do_poll > do_pollfd > 我们自己写的poll函数后,再调用schedule_timeout进入休眠。如果我们的驱动程序发现情况就绪,可以把这个队列上挂着的进程唤醒。可见,poll_wait的作用,只是为了让驱动程序能找到要唤醒的进程。即使不用poll_wait,我们的程序也有机会被唤醒:chedule_timeout(__timeout),只是休眠__time_out这段时间。

总结一下poll机制

  1. poll > sys_poll > do_sys_poll >poll_initwait,poll_initwait函数注册一下回调函数__pollwait,它就是我们的驱动程序执行poll_wait时,真正被调用的函数。

  2. 接下来执行file->f_op->poll,即我们驱动程序里自己实现的poll函数

   它会调用poll_wait把自己挂入某个队列,这个队列也是我们的驱动自己定义的;

   它还判断一下设备是否就绪。

  1. 如果设备未就绪,do_sys_poll里会让进程休眠一定时间,这个时间是应用提供的“超时时间”

  2. 进程被唤醒的条件有2:一是上面说的“一定时间”到了,二是被驱动程序唤醒。驱动程序发现条件就绪时,就把“某个队列”上挂着的进程唤醒,这个队列,就是前面通过poll_wait把本进程挂过去的队列。

  3. 如果驱动程序没有去唤醒进程,那么chedule_timeout(__timeou)超时后,会重复2、3动作1次,直到应用程序的poll调用传入的时间到达, 然后返回。

Guess you like

Origin juejin.im/post/7035212170476388359