Linux accept系统调用

注:本文分析基于3.10.0-693.el7内核版本,即CentOS 7.4

1、函数原型

int accept(int sockfd, struct sockaddr *addr, socklen_t *addrlen);  

参数说明:

sockfd:套接字的文件描述符,socket()系统调用返回的文件描述符fd

addr:指向存放地址信息的结构体的首地址

addrlen:存放地址信息的结构体的大小,其实也就是sizof(struct sockaddr)

可以看出,bind(),connect(),以及accept()的参数都是一致的。

2、内核实现

SYSCALL_DEFINE3(accept, int, fd, struct sockaddr __user *, upeer_sockaddr,
        int __user *, upeer_addrlen)
{
    return sys_accept4(fd, upeer_sockaddr, upeer_addrlen, 0);
}

最终调用的是SYSCALL_DEFINE4(accept……

SYSCALL_DEFINE4(accept4, int, fd, struct sockaddr __user *, upeer_sockaddr,
        int __user *, upeer_addrlen, int, flags)
{
    struct socket *sock, *newsock;
    struct file *newfile;
    int err, len, newfd, fput_needed;
    struct sockaddr_storage address;

    if (flags & ~(SOCK_CLOEXEC | SOCK_NONBLOCK))
        return -EINVAL;

    if (SOCK_NONBLOCK != O_NONBLOCK && (flags & SOCK_NONBLOCK))
        flags = (flags & ~SOCK_NONBLOCK) | O_NONBLOCK;

    //根据fd获取对应的socket结构
    sock = sockfd_lookup_light(fd, &err, &fput_needed);
    if (!sock)
        goto out;

    err = -ENFILE;
    //分配一个新的socket结构体
    newsock = sock_alloc();
    if (!newsock)
        goto out_put;

    newsock->type = sock->type;
    newsock->ops = sock->ops;

    __module_get(newsock->ops->owner);

    //获取一个未使用的文件描述符,这个描述符也就是accept()返回的fd
    newfd = get_unused_fd_flags(flags);
    if (unlikely(newfd < 0)) {
        err = newfd;
        sock_release(newsock);
        goto out_put;
    }
    //创建一个file结构体,同时将这个file结构体和刚刚创建的socket关联
    //file->private_data指向socket
    newfile = sock_alloc_file(newsock, flags, sock->sk->sk_prot_creator->name);
    if (IS_ERR(newfile)) {
        err = PTR_ERR(newfile);
        put_unused_fd(newfd);
        sock_release(newsock);
        goto out_put;
    }

    err = security_socket_accept(sock, newsock);
    if (err)
        goto out_fd;

    //调用inet_accept()执行主处理操作
    err = sock->ops->accept(sock, newsock, sock->file->f_flags);
    if (err < 0)
        goto out_fd;
    //如果要获取对端连接信息,那么拷贝对应信息到用户空间
    if (upeer_sockaddr) {
        //调用inet_getname()获取对端信息
        if (newsock->ops->getname(newsock, (struct sockaddr *)&address,
                      &len, 2) < 0) {
            err = -ECONNABORTED;
            goto out_fd;
        }
        err = move_addr_to_user(&address,
                    len, upeer_sockaddr, upeer_addrlen);
        if (err < 0)
            goto out_fd;
    }

    /* File flags are not inherited via accept() unlike another OSes. */
    //将文件描述符fd和文件结构体file关联到一起
    fd_install(newfd, newfile);
    err = newfd;//返回新分配的文件描述符

out_put:
    fput_light(sock->file, fput_needed);
out:
    return err;
out_fd:
    fput(newfile);
    put_unused_fd(newfd);
    goto out_put;
}

新建socket结构体,然后也分配一个file结构体,并将这两个结构体相关联,这些操作socket()系统调用里也有,包括后面和文件描述符fd关联,总的就是将fd和文件系统以及网络联系到一起,形成一切皆文件的Unix理念。有了socket结构体,那肯定需要有对应的sock结构体,这就是sock->ops->accept()所做的了。sock->ops指向inet_stream_ops

const struct proto_ops inet_stream_ops = {
    .family        = PF_INET,
    .owner         = THIS_MODULE,
    .release       = inet_release,
    .bind          = inet_bind,
    .connect       = inet_stream_connect,
    .socketpair    = sock_no_socketpair,
    .accept        = inet_accept,
    .getname       = inet_getname,
...
};

所以调用的就是inet_accept()

int inet_accept(struct socket *sock, struct socket *newsock, int flags)
{
    struct sock *sk1 = sock->sk;
    int err = -EINVAL;
    //调用对应协议的accept函数,对于TCP而言,调用的是inet_csk_accept
    struct sock *sk2 = sk1->sk_prot->accept(sk1, flags, &err);

    if (!sk2)
        goto do_err;

    lock_sock(sk2);

    sock_rps_record_flow(sk2);
    WARN_ON(!((1 << sk2->sk_state) &
          (TCPF_ESTABLISHED | TCPF_SYN_RECV |
          TCPF_CLOSE_WAIT | TCPF_CLOSE)));

    //将新分配的socket和接收到的sock相互关联
    sock_graft(sk2, newsock);
    //返回的新socket状态为已连接
    newsock->state = SS_CONNECTED;
    err = 0;
    release_sock(sk2);
do_err:
    return err;
}

然后调用对应协议的accept函数,对于TCP协议,

struct proto tcp_prot = {
    .name           = "TCP",
    .owner          = THIS_MODULE,
    .close          = tcp_close,
    .connect        = tcp_v4_connect,
    .disconnect     = tcp_disconnect,
    .accept         = inet_csk_accept,
    .ioctl          = tcp_ioctl,
...
};

因此TCP协议里,对应的accept函数就是inet_csk_accept()

struct sock *inet_csk_accept(struct sock *sk, int flags, int *err)
{
    struct inet_connection_sock *icsk = inet_csk(sk);
    struct request_sock_queue *queue = &icsk->icsk_accept_queue;
    struct sock *newsk;
    struct request_sock *req;
    int error;

    lock_sock(sk);

    /* We need to make sure that this socket is listening,
     * and that it has something pending.
     */
    error = -EINVAL;
    if (sk->sk_state != TCP_LISTEN)
        goto out_err;

    /* Find already established connection */
    //如果等待accept的socket队列为空,获取超时时间并等待
    if (reqsk_queue_empty(queue)) {
        //如果设置的是非阻塞,获取接收数据的超时时间
        //可以通过SO_RCVTIMEO选项设置
        long timeo = sock_rcvtimeo(sk, flags & O_NONBLOCK);

        /* If this is a non blocking socket don't sleep */
        error = -EAGAIN;
        if (!timeo)
            goto out_err;
        //等待可accept的请求到来
        error = inet_csk_wait_for_connect(sk, timeo);
        if (error)
            goto out_err;
    }
    //从全连接accept队列里摘出第一个request_sock处理
    req = reqsk_queue_remove(queue);
    //将request_sock和sock关联,这样返回后才能继续处理
    //其实也就是替代req接管这个请求了
    //req->sk就是在第三次握手后服务端新创建的sock
    newsk = req->sk;
    //sk_ack_backlog计数减1
    sk_acceptq_removed(sk);
    //快速开启选项打开的情况,
    if (sk->sk_protocol == IPPROTO_TCP && queue->fastopenq != NULL) {
        spin_lock_bh(&queue->fastopenq->lock);
        if (tcp_rsk(req)->listener) {
            req->sk = NULL;
            req = NULL;
        }
        spin_unlock_bh(&queue->fastopenq->lock);
    }
out:
    release_sock(sk);//listen的sock
    //请求已被newsk接管,因此这个请求可以释放了
    if (req)
        __reqsk_free(req);
    return newsk;
out_err:
    newsk = NULL;
    req = NULL;
    *err = error;
    goto out;
}

获取可accept的请求,如果此时尚未有客户端发起连接,那就睡眠直到有请求到来,或者如果用户设置了超时时间,也会超时返回。另外,也有可能被信号打断。

static int inet_csk_wait_for_connect(struct sock *sk, long timeo)
{
    struct inet_connection_sock *icsk = inet_csk(sk);
    DEFINE_WAIT(wait);
    int err;

    for (;;) {//循环直到有请求到来或者超时或者被信号打断
        prepare_to_wait_exclusive(sk_sleep(sk), &wait,
                      TASK_INTERRUPTIBLE);
        release_sock(sk);//listen的sock
        //先检查一下再调度出去
        if (reqsk_queue_empty(&icsk->icsk_accept_queue))
            timeo = schedule_timeout(timeo);//调度出去
        lock_sock(sk);
        err = 0;
        //有请求过来
        if (!reqsk_queue_empty(&icsk->icsk_accept_queue))
            break;
        err = -EINVAL;
        if (sk->sk_state != TCP_LISTEN)
            break;
        err = sock_intr_errno(timeo);
        //被信号打断
        if (signal_pending(current))
            break;
        err = -EAGAIN;
        //超时时间到
        if (!timeo)
            break;
    }
    finish_wait(sk_sleep(sk), &wait);
    return err;
}

当有请求到来后,就从全连接队列里取出这个请求,返回请求指向的sock结构体,这个结构体也就是在第三次握手中新建的child sock。然后将这个sock结构体和accept最开始创建的socket结构体关联,通过sock_graft()完成关联。

static inline void sock_graft(struct sock *sk, struct socket *parent)
{
    //sk为全连接队列返回的请求,parent是新分配的socket
    write_lock_bh(&sk->sk_callback_lock);
    sk->sk_wq = parent->wq;
    parent->sk = sk;//新分配的socket的sk指针指向刚接收的请求
    sk_set_socket(sk, parent);
    security_sock_graft(sk, parent);
    write_unlock_bh(&sk->sk_callback_lock);
}

static inline void sk_set_socket(struct sock *sk, struct socket *sock)
{
    sk_tx_queue_clear(sk);
    //刚接收的请求的sk_socket指针指向刚分配的socket
    sk->sk_socket = sock;
}

最后,调用fd_install()将fd安装到对应file结构体中,完成accept()的调用。

关于fd、file、socket、sock等结构体的关系可以参考
Linux socket系统调用(一)

我们概括下accept的大概流程:

  1. 创建一个socket结构体
  2. 获取一个未使用的文件描述符fd
  3. 创建一个file结构体,并和socket关联
  4. 从全连接队列中获取客户端发来的请求
  5. 根据请求获取之前新建的sock结构体返回
  6. 将请求中的sock结构体和开始分配的socket结构体关联
  7. 将文件描述符fd和文件结构体file关联,并返回fd供用户使用

猜你喜欢

转载自blog.csdn.net/u010039418/article/details/80628490