TCP แอดเดรสซ็อกเก็ตโลคัลที่ถูกผูกไว้ไม่พร้อมใช้งานนานเท่าใดหลังจากปิดแล้ว


13

บน Linux (เซิร์ฟเวอร์ที่ใช้งานจริงของฉันอยู่ใน RHEL 5.5 - ลิงค์ LXR ด้านล่างเป็นเวอร์ชั่นของเคอร์เนล) man 7 ipกล่าวว่า:

ที่อยู่ซ็อกเก็ต TCP ท้องถิ่นที่ถูกผูกไว้ไม่สามารถใช้งานได้หลังจากปิดไปแล้วยกเว้นว่าตั้งค่าสถานะ SO_REUSEADDR แล้ว

SO_REUSEADDRฉันไม่ได้ใช้ "บางครั้ง" นานแค่ไหน? ฉันจะทราบได้ว่านานแค่ไหนและฉันจะเปลี่ยนได้อย่างไร

ฉันทำตัวยุ่งเหยิงไปรอบ ๆ นี้และพบข้อมูลบางอย่างที่ไม่สามารถอธิบายได้จากมุมมองของโปรแกรมเมอร์แอปพลิเคชัน เพื่อปัญญา:

  • TCP_TIMEWAIT_LENในnet/tcp.hคือ "ระยะเวลารอที่จะทำลายสถานะ TIME-WAIT" และได้รับการแก้ไขที่ "ประมาณ 60 วินาที"
  • / proc / sys / net / ipv4 / tcp_fin_timeoutคือ "เวลาเก็บซ็อกเก็ตในสถานะ FIN-WAIT-2 หากปิดด้านข้างของเรา" และ "ค่าเริ่มต้นคือ 60 วินาที"

ที่ซึ่งฉันสะดุดอยู่ในการเชื่อมช่องว่างระหว่างโมเดลของเคอร์เนลของวงจรชีวิต TCP และโมเดลของพอร์ตของโปรแกรมเมอร์ไม่พร้อมใช้งานนั่นคือในการทำความเข้าใจว่าสถานะเหล่านี้เกี่ยวข้องกับ "บางเวลา" อย่างไร


@Caleb: เกี่ยวกับแท็ก bind คือการเรียกของระบบด้วย! ลองman 2 bindถ้าคุณไม่เชื่อฉัน เป็นที่ยอมรับว่าอาจไม่ใช่สิ่งแรกที่คนยูนิกซ์นึกถึงเมื่อมีคนพูดว่า "ผูก" ดังนั้นก็ยุติธรรมพอ
Tom Anderson

ฉันทราบดีถึงการใช้ทางเลือกbindแต่แท็กที่นี่ถูกนำไปใช้กับเซิร์ฟเวอร์ DNS โดยเฉพาะ เราไม่มีแท็กสำหรับการเรียกใช้ระบบทุกครั้ง
คาเลบ

คำตอบ:


14

ฉันเชื่อว่าแนวคิดของซ็อกเก็ตที่ใช้งานไม่ได้กับโปรแกรมคืออนุญาตให้ส่วนข้อมูล TCP ใด ๆ ที่ยังคงอยู่ในระหว่างการส่งมาถึงและได้รับการละทิ้งโดยเคอร์เนล นั่นคือเป็นไปได้ที่แอปพลิเคชั่นจะเรียกclose(2)ใช้ซ็อกเก็ต แต่การกำหนดเส้นทางล่าช้าหรือเกิดอุบัติเหตุเพื่อควบคุมแพ็คเก็ตหรือสิ่งใดที่คุณสามารถอนุญาตให้อีกด้านหนึ่งของการเชื่อมต่อ TCP ส่งข้อมูลในขณะนั้น แอปพลิเคชั่นระบุว่าไม่ต้องการจัดการกับเซ็กเมนต์ข้อมูล TCP อีกต่อไปดังนั้นเคอร์เนลควรทิ้งพวกเขาเมื่อพวกเขาเข้ามา

ฉันแฮ็คโปรแกรมเล็ก ๆ ใน C ที่คุณสามารถรวบรวมและใช้เพื่อดูว่าหมดเวลานานแค่ไหน:

#include <stdio.h>        /* fprintf() */
#include <string.h>       /* strerror() */
#include <errno.h>        /* errno */
#include <stdlib.h>       /* strtol() */
#include <signal.h>       /* signal() */
#include <sys/time.h>     /* struct timeval */
#include <unistd.h>       /* read(), write(), close(), gettimeofday() */
#include <sys/types.h>    /* socket() */
#include <sys/socket.h>   /* socket-related stuff */
#include <netinet/in.h>
#include <arpa/inet.h>    /* inet_ntoa() */
float elapsed_time(struct timeval before, struct timeval after);
int
main(int ac, char **av)
{
        int opt;
        int listen_fd = -1;
        unsigned short port = 0;
        struct sockaddr_in  serv_addr;
        struct timeval before_bind;
        struct timeval after_bind;

        while (-1 != (opt = getopt(ac, av, "p:"))) {
                switch (opt) {
                case 'p':
                        port = (unsigned short)atoi(optarg);
                        break;
                }
        }

        if (0 == port) {
                fprintf(stderr, "Need a port to listen on\n");
                return 2;
        }

        if (0 > (listen_fd = socket(AF_INET, SOCK_STREAM, 0))) {
                fprintf(stderr, "Opening socket: %s\n", strerror(errno));
                return 1;
        }

        memset(&serv_addr, '\0', sizeof(serv_addr));
        serv_addr.sin_family      = AF_INET;
        serv_addr.sin_addr.s_addr = htonl(INADDR_ANY);
        serv_addr.sin_port        = htons(port);

        gettimeofday(&before_bind, NULL);
        while (0 > bind(listen_fd, (struct sockaddr *)&serv_addr, sizeof(serv_addr))) {
                fprintf(stderr, "binding socket to port %d: %s\n",
                        ntohs(serv_addr.sin_port),
                        strerror(errno));

                sleep(1);
        }
        gettimeofday(&after_bind, NULL);
        printf("bind took %.5f seconds\n", elapsed_time(before_bind, after_bind));

        printf("# Listening on port %d\n", ntohs(serv_addr.sin_port));
        if (0 > listen(listen_fd, 100)) {
                fprintf(stderr, "listen() on fd %d: %s\n",
                        listen_fd,
                        strerror(errno));
                return 1;
        }

        {
                struct sockaddr_in  cli_addr;
                struct timeval before;
                int newfd;
                socklen_t clilen;

                clilen = sizeof(cli_addr);

                if (0 > (newfd = accept(listen_fd, (struct sockaddr *)&cli_addr, &clilen))) {
                        fprintf(stderr, "accept() on fd %d: %s\n", listen_fd, strerror(errno));
                        exit(2);
                }
                gettimeofday(&before, NULL);
                printf("At %ld.%06ld\tconnected to: %s\n",
                        before.tv_sec, before.tv_usec,
                        inet_ntoa(cli_addr.sin_addr)
                );
                fflush(stdout);

                while (close(newfd) == EINTR) ;
        }

        if (0 > close(listen_fd))
                fprintf(stderr, "Closing socket: %s\n", strerror(errno));

        return 0;
}
float
elapsed_time(struct timeval before, struct timeval after)
{
        float r = 0.0;

        if (before.tv_usec > after.tv_usec) {
                after.tv_usec += 1000000;
                --after.tv_sec;
        }

        r = (float)(after.tv_sec - before.tv_sec)
                + (1.0E-6)*(float)(after.tv_usec - before.tv_usec);

        return r;
}

ฉันลองโปรแกรมนี้ใน 3 เครื่องที่แตกต่างกันและฉันได้รับเวลาตัวแปรระหว่าง 55 ถึง 59 วินาทีเมื่อเคอร์เนลปฏิเสธที่จะอนุญาตให้ผู้ใช้ที่ไม่ใช่รูทเปิดซ็อกเก็ตอีกครั้ง ฉันรวบรวมรหัสข้างต้นเพื่อปฏิบัติการที่เรียกว่า "ผู้เปิด" และวิ่งได้ดังนี้:

./opener -p 7896; ./opener -p 7896

ฉันเปิดหน้าต่างอื่นแล้วทำสิ่งนี้:

telnet otherhost 7896

ที่ทำให้อินสแตนซ์แรกของ "ตัวเปิด" ยอมรับการเชื่อมต่อจากนั้นปิด อินสแตนซ์ที่สองของ "ตัวเปิด" พยายามที่bind(2)จะพอร์ต TCP 7896 ทุกวินาที "ตัวเปิด" รายงานการหน่วงเวลา 55 ถึง 59 วินาที

ผมพบว่ามีคนแนะนำให้ทำเช่นนี้:

echo 30 > /proc/sys/net/ipv4/tcp_fin_timeout

เพื่อลดช่วงเวลานั้น มันไม่ได้ผลสำหรับฉัน จาก 4 เครื่องที่ฉันใช้งาน linux, สองเครื่องมี 30 และสองเครื่องมี 60 เครื่องฉันตั้งค่าต่ำสุดที่ 10 ไม่แตกต่างจากโปรแกรม "ตัวเปิด"

ทำสิ่งนี้:

echo 1 > /proc/sys/net/ipv4/tcp_tw_recycle

เปลี่ยนสิ่งต่าง ๆ "ตัวเปิด" ที่สองใช้เวลาเพียง 3 วินาทีในการรับซ็อกเก็ตใหม่


3
ฉันเข้าใจ (คร่าวๆ) ว่าจุดประสงค์ของช่วงเวลาที่ไม่มีให้คืออะไร สิ่งที่ฉันอยากรู้คือระยะเวลานั้นอยู่บนลีนุกซ์และสามารถเปลี่ยนแปลงได้อย่างไร ปัญหาเกี่ยวกับตัวเลขจากหน้า Wikipedia เกี่ยวกับ TCP คือมันจำเป็นต้องเป็นค่าทั่วไปไม่ใช่สิ่งที่เป็นจริงของแพลตฟอร์มเฉพาะของฉัน
Tom Anderson

การคาดเดาของคุณน่าสนใจ! เพียงตั้งค่าสถานะพวกเขาด้วยชื่อแทนการลบพวกเขามันมีวิธีการค้นหาเหตุผลว่าทำไม!
Philippe Gachoud
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.