]> git.saurik.com Git - apple/xnu.git/blobdiff - bsd/kern/bsd_init.c
xnu-4570.20.62.tar.gz
[apple/xnu.git] / bsd / kern / bsd_init.c
index 105922628243f3dfbbf1b2768570f21eeef29825..22a932314ab27056b4c6bc2a857f45314f16c93c 100644 (file)
@@ -1,5 +1,5 @@
 /*
- * Copyright (c) 2000-2013 Apple Inc. All rights reserved.
+ * Copyright (c) 2000-2015 Apple Inc. All rights reserved.
  *
  * @APPLE_OSREFERENCE_LICENSE_HEADER_START@
  * 
@@ -94,6 +94,7 @@
 #include <sys/time.h>
 #include <sys/systm.h>
 #include <sys/mman.h>
+#include <sys/kasl.h>
 
 #include <security/audit/audit.h>
 
 #include <mach/exception_types.h>
 #include <dev/busvar.h>                        /* for pseudo_inits */
 #include <sys/kdebug.h>
+#include <sys/monotonic.h>
+#include <sys/reason.h>
 
 #include <mach/mach_types.h>
 #include <mach/vm_prot.h>
 #include <sys/mcache.h>                        /* for mcache_init() */
 #include <sys/mbuf.h>                  /* for mbinit() */
 #include <sys/event.h>                 /* for knote_init() */
+#include <sys/eventhandler.h>          /* for eventhandler_init() */
 #include <sys/kern_memorystatus.h>     /* for memorystatus_init() */
 #include <sys/aio_kern.h>              /* for aio_init() */
 #include <sys/semaphore.h>             /* for psem_cache_init() */
 #include <netinet/flow_divert.h>       /* flow_divert_init() */
 #include <net/content_filter.h>                /* for cfil_init() */
 #include <net/necp.h>                  /* for necp_init() */
+#include <net/network_agent.h>         /* for netagent_init() */
 #include <net/packet_mangler.h>                /* for pkt_mnglr_init() */
 #include <net/if_utun.h>               /* for utun_register_control() */
-#include <net/if_ipsec.h>       /* for ipsec_register_control() */
+#include <net/if_ipsec.h>              /* for ipsec_register_control() */
 #include <net/net_str_id.h>            /* for net_str_id_init() */
 #include <net/netsrc.h>                        /* for netsrc_init() */
 #include <net/ntstat.h>                        /* for nstat_init() */
 #include <netinet/tcp_cc.h>                    /* for tcp_cc_init() */
+#include <netinet/mptcp_var.h>         /* for mptcp_control_register() */
+#include <net/nwk_wq.h>                        /* for nwk_wq_init */
 #include <kern/assert.h>               /* for assert() */
 #include <sys/kern_overrides.h>                /* for init_system_override() */
 
 #include <net/if_pflog.h>
 #endif
 
+
 #include <pexpert/pexpert.h>
 #include <machine/pal_routines.h>
 #include <console/video_console.h>
 
+
 void * get_user_regs(thread_t);                /* XXX kludge for <machine/thread.h> */
 void IOKitInitializeTime(void);                /* XXX */
 void IOSleep(unsigned int);            /* XXX */
@@ -235,7 +244,7 @@ int         hostnamelen;
 char   domainname[MAXDOMNAMELEN];
 int            domainnamelen;
 
-char rootdevice[16];   /* hfs device names have at least 9 chars */
+char rootdevice[DEVMAXNAMESIZE];
 
 #if  KMEMSTATS
 struct kmemstats kmemstats[M_LAST];
@@ -243,6 +252,18 @@ struct     kmemstats kmemstats[M_LAST];
 
 struct vnode *rootvp;
 int boothowto = RB_DEBUG;
+int minimalboot = 0;
+#if CONFIG_EMBEDDED
+int darkboot = 0;
+#endif
+
+#if PROC_REF_DEBUG
+__private_extern__ int proc_ref_tracking_disabled = 0; /* disable panics on leaked proc refs across syscall boundary */
+#endif
+
+#if OS_REASON_DEBUG
+__private_extern__ int os_reason_debug_disabled = 0; /* disable asserts for when we fail to allocate OS reasons */
+#endif
 
 extern kern_return_t IOFindBSDRoot(char *, unsigned int, dev_t *, u_int32_t *);
 extern void IOSecureBSDRoot(const char * rootName);
@@ -251,8 +272,8 @@ extern void kminit(void);
 extern void file_lock_init(void);
 extern void kmeminit(void);
 extern void bsd_bufferinit(void);
+extern void oslog_setsize(int size);
 extern void throttle_init(void);
-extern void macx_init(void);
 extern void acct_init(void);
 
 extern int serverperfmode;
@@ -269,8 +290,15 @@ __private_extern__ vm_offset_t * execargs_cache = NULL;
 
 void bsd_exec_setup(int);
 
+#if __arm64__
+__private_extern__ int bootarg_no64exec = 0;
+#endif
 __private_extern__ int bootarg_vnode_cache_defeat = 0;
 
+#if CONFIG_JETSAM && (DEVELOPMENT || DEBUG)
+__private_extern__ int bootarg_no_vnode_jetsam = 0;
+#endif /* CONFIG_JETSAM && (DEVELOPMENT || DEBUG) */
+
 /*
  * Prevent kernel-based ASLR from being used, for testing.
  */
@@ -278,21 +306,27 @@ __private_extern__ int bootarg_vnode_cache_defeat = 0;
 __private_extern__ int bootarg_disable_aslr = 0;
 #endif
 
+/*
+ * Allow an alternate dyld to be used for testing.
+ */
+
+#if DEVELOPMENT || DEBUG
+char dyld_alt_path[MAXPATHLEN];
+int use_alt_dyld = 0;
+#endif
+
 int    cmask = CMASK;
 extern int customnbuf;
 
-void bsd_init(void);
 kern_return_t bsd_autoconf(void);
 void bsd_utaskbootstrap(void);
 
 static void parse_bsd_args(void);
-extern task_t bsd_init_task;
-extern char    init_task_failure_data[];
 #if CONFIG_DEV_KMEM
 extern void dev_kmem_init(void);
 #endif
 extern void time_zone_slock_init(void);
-extern void select_wait_queue_init(void);
+extern void select_waitq_init(void);
 static void process_name(const char *, proc_t);
 
 static void setconf(void);
@@ -307,6 +341,8 @@ extern void sysv_sem_lock_init(void);
 extern void sysv_msg_lock_init(void);
 #endif
 
+extern void ulock_initialize(void);
+
 #if CONFIG_MACF
 #if defined (__i386__) || defined (__x86_64__)
 /* MACF policy_check configuration flags; see policy_check.c for details */
@@ -339,11 +375,8 @@ extern int check_policy_init(int);
 static void
 process_name(const char *s, proc_t p)
 {
-       size_t length = strlen(s);
-
-       bcopy(s, p->p_comm,
-               length >= sizeof(p->p_comm) ? sizeof(p->p_comm) :
-                       length + 1);
+       strlcpy(p->p_comm, s, sizeof(p->p_comm));
+       strlcpy(p->p_name, s, sizeof(p->p_name));
 }
 
 /* To allow these values to be patched, they're globals here */
@@ -358,18 +391,33 @@ extern int        (*mountroot)(void);
 lck_grp_t * proc_lck_grp;
 lck_grp_t * proc_slock_grp;
 lck_grp_t * proc_fdmlock_grp;
+lck_grp_t * proc_kqhashlock_grp;
+lck_grp_t * proc_knhashlock_grp;
+lck_grp_t * proc_ucred_mlock_grp;
 lck_grp_t * proc_mlock_grp;
 lck_grp_attr_t * proc_lck_grp_attr;
 lck_attr_t * proc_lck_attr;
 lck_mtx_t * proc_list_mlock;
 lck_mtx_t * proc_klist_mlock;
 
+
 extern lck_mtx_t * execargs_cache_lock;
 
 /* hook called after root is mounted XXX temporary hack */
 void (*mountroot_post_hook)(void);
 void (*unmountroot_pre_hook)(void);
 
+/*
+ * This function is called before IOKit initialization, so that globals
+ * like the sysctl tree are initialized before kernel extensions
+ * are started (since they may want to register sysctls
+ */
+void
+bsd_early_init(void)
+{
+       sysctl_early_init();
+}
+
 /*
  * This function is called very early on in the Mach startup, from the
  * function start_kernel_threads() in osfmk/kern/startup.c.  It's called
@@ -440,11 +488,15 @@ bsd_init(void)
        proc_lck_grp_attr= lck_grp_attr_alloc_init();
 
        proc_lck_grp = lck_grp_alloc_init("proc",  proc_lck_grp_attr);
+
 #if CONFIG_FINE_LOCK_GROUPS
        proc_slock_grp = lck_grp_alloc_init("proc-slock",  proc_lck_grp_attr);
-       proc_fdmlock_grp = lck_grp_alloc_init("proc-fdmlock",  proc_lck_grp_attr);
+       proc_ucred_mlock_grp = lck_grp_alloc_init("proc-ucred-mlock",  proc_lck_grp_attr);
        proc_mlock_grp = lck_grp_alloc_init("proc-mlock",  proc_lck_grp_attr);
+       proc_fdmlock_grp = lck_grp_alloc_init("proc-fdmlock",  proc_lck_grp_attr);
 #endif
+       proc_kqhashlock_grp = lck_grp_alloc_init("proc-kqhashlock",  proc_lck_grp_attr);
+       proc_knhashlock_grp = lck_grp_alloc_init("proc-knhashlock",  proc_lck_grp_attr);
        /* Allocate proc lock attribute */
        proc_lck_attr = lck_attr_alloc_init();
 #if 0
@@ -458,12 +510,14 @@ bsd_init(void)
        proc_klist_mlock = lck_mtx_alloc_init(proc_mlock_grp, proc_lck_attr);
        lck_mtx_init(&kernproc->p_mlock, proc_mlock_grp, proc_lck_attr);
        lck_mtx_init(&kernproc->p_fdmlock, proc_fdmlock_grp, proc_lck_attr);
+       lck_mtx_init(&kernproc->p_ucred_mlock, proc_ucred_mlock_grp, proc_lck_attr);
        lck_spin_init(&kernproc->p_slock, proc_slock_grp, proc_lck_attr);
 #else
        proc_list_mlock = lck_mtx_alloc_init(proc_lck_grp, proc_lck_attr);
        proc_klist_mlock = lck_mtx_alloc_init(proc_lck_grp, proc_lck_attr);
        lck_mtx_init(&kernproc->p_mlock, proc_lck_grp, proc_lck_attr);
        lck_mtx_init(&kernproc->p_fdmlock, proc_lck_grp, proc_lck_attr);
+       lck_mtx_init(&kernproc->p_ucred_mlock, proc_lck_grp, proc_lck_attr);
        lck_spin_init(&kernproc->p_slock, proc_lck_grp, proc_lck_attr);
 #endif
 
@@ -486,7 +540,6 @@ bsd_init(void)
         * Initialize the MAC Framework
         */
        mac_policy_initbsd();
-       kernproc->p_mac_enforce = 0;
 
 #if defined (__i386__) || defined (__x86_64__)
        /*
@@ -499,6 +552,8 @@ bsd_init(void)
 
        /* Initialize System Override call */
        init_system_override();
+       
+       ulock_initialize();
 
        /*
         * Create process 0.
@@ -533,8 +588,8 @@ bsd_init(void)
        LIST_INSERT_HEAD(SESSHASH(0), &session0, s_hash);
        proc_list_unlock();
 
-#if CONFIG_LCTX
-       kernproc->p_lctx = NULL;
+#if CONFIG_PERSONAS
+       kernproc->p_persona = NULL;
 #endif
 
        kernproc->task = kernel_task;
@@ -543,7 +598,11 @@ bsd_init(void)
        kernproc->p_flag = P_SYSTEM;
        kernproc->p_lflag = 0;
        kernproc->p_ladvflag = 0;
-       
+
+#if defined(__LP64__)
+       kernproc->p_flag |= P_LP64;
+#endif
+
 #if DEVELOPMENT || DEBUG
        if (bootarg_disable_aslr)
                kernproc->p_flag |= P_DISABLE_ASLR;
@@ -607,6 +666,8 @@ bsd_init(void)
        filedesc0.fd_knlist = NULL;
        filedesc0.fd_knhash = NULL;
        filedesc0.fd_knhashmask = 0;
+       lck_mtx_init(&filedesc0.fd_kqhashlock, proc_kqhashlock_grp, proc_lck_attr);
+       lck_mtx_init(&filedesc0.fd_knhashlock, proc_knhashlock_grp, proc_lck_attr);
 
        /* Create the limits structures. */
        kernproc->p_limit = &limit0;
@@ -644,11 +705,16 @@ bsd_init(void)
                                (vm_size_t)bsd_pageable_map_size,
                                TRUE,
                                VM_FLAGS_ANYWHERE,
+                               VM_MAP_KERNEL_FLAGS_NONE,
+                               VM_KERN_MEMORY_BSD,
                                &bsd_pageable_map);
                if (ret != KERN_SUCCESS) 
                        panic("bsd_init: Failed to allocate bsd pageable map");
        }
 
+       bsd_init_kprintf("calling fpxlog_init\n");
+       fpxlog_init();
+
        /*
         * Initialize buffers and hash links for buffers
         *
@@ -659,12 +725,6 @@ bsd_init(void)
        bsd_init_kprintf("calling bsd_bufferinit\n");
        bsd_bufferinit();
 
-       /* Initialize the execve() semaphore */
-       bsd_init_kprintf("calling semaphore_create\n");
-
-       if (ret != KERN_SUCCESS)
-               panic("bsd_init: Failed to create execve semaphore");
-
        /*
         * Initialize the calendar.
         */
@@ -674,12 +734,6 @@ bsd_init(void)
        bsd_init_kprintf("calling ubc_init\n");
        ubc_init();
 
-       /*
-        * Initialize device-switches.
-        */
-       bsd_init_kprintf("calling devsw_init() \n");
-       devsw_init();
-
        /* Initialize the file systems. */
        bsd_init_kprintf("calling vfsinit\n");
        vfsinit();
@@ -713,6 +767,10 @@ bsd_init(void)
        bsd_init_kprintf("calling knote_init\n");
        knote_init();
 
+       /* Initialize event handler */
+       bsd_init_kprintf("calling eventhandler_init\n");
+       eventhandler_init();
+
        /* Initialize for async IO */
        bsd_init_kprintf("calling aio_init\n");
        aio_init();
@@ -749,18 +807,16 @@ bsd_init(void)
        psem_cache_init();
        bsd_init_kprintf("calling time_zone_slock_init\n");
        time_zone_slock_init();
-       bsd_init_kprintf("calling select_wait_queue_init\n");
-       select_wait_queue_init();
+       bsd_init_kprintf("calling select_waitq_init\n");
+       select_waitq_init();
 
        /*
         * Initialize protocols.  Block reception of incoming packets
         * until everything is ready.
         */
-       bsd_init_kprintf("calling sysctl_register_fixed\n");
-       sysctl_register_fixed(); 
-       bsd_init_kprintf("calling sysctl_mib_init\n");
-       sysctl_mib_init();
 #if NETWORKING
+       bsd_init_kprintf("calling nwk_wq_init\n");
+       nwk_wq_init();
        bsd_init_kprintf("calling dlil_init\n");
        dlil_init();
        bsd_init_kprintf("calling proto_kpi_init\n");
@@ -776,7 +832,6 @@ bsd_init(void)
        flow_divert_init();
 #endif /* FLOW_DIVERT */
 #endif /* SOCKETS */
-
        kernproc->p_fd->fd_cdir = NULL;
        kernproc->p_fd->fd_rdir = NULL;
 
@@ -795,9 +850,6 @@ bsd_init(void)
        memorystatus_init();
 #endif /* CONFIG_MEMORYSTATUS */
 
-       bsd_init_kprintf("calling macx_init\n");
-       macx_init();
-
        bsd_init_kprintf("calling acct_init\n");
        acct_init();
 
@@ -806,9 +858,15 @@ bsd_init(void)
        kmstartup();
 #endif
 
+       bsd_init_kprintf("calling sysctl_mib_init\n");
+       sysctl_mib_init()
+
        bsd_init_kprintf("calling bsd_autoconf\n");
        bsd_autoconf();
 
+       bsd_init_kprintf("calling os_reason_init\n");
+       os_reason_init();
+
 #if CONFIG_DTRACE
        dtrace_postinit();
 #endif
@@ -856,7 +914,9 @@ bsd_init(void)
        /* Initialize Network Extension Control Policies */
        necp_init();
 #endif
-       
+
+       netagent_init();
+
        /* register user tunnel kernel control handler */
        utun_register_control();
 #if IPSEC
@@ -865,6 +925,9 @@ bsd_init(void)
        netsrc_init();
        nstat_init();
        tcp_cc_init();
+#if MPTCP
+       mptcp_control_register();
+#endif /* MPTCP */
 #endif /* NETWORKING */
 
        bsd_init_kprintf("calling vnode_pager_bootstrap\n");
@@ -965,7 +1028,7 @@ bsd_init(void)
            devfs_kernel_mount(mounthere);
        }
 #endif /* DEVFS */
-       
+
        /* Initialize signal state for process 0. */
        bsd_init_kprintf("calling siginit\n");
        siginit(kernproc);
@@ -973,10 +1036,6 @@ bsd_init(void)
        bsd_init_kprintf("calling bsd_utaskbootstrap\n");
        bsd_utaskbootstrap();
 
-#if defined(__LP64__)
-       kernproc->p_flag |= P_LP64;
-#endif
-
        pal_kernel_announce();
 
        bsd_init_kprintf("calling mountroot_post_hook\n");
@@ -1012,12 +1071,15 @@ bsdinit_task(void)
 
        ut = (uthread_t)get_bsdthread_info(thread);
 
-       bsd_init_task = get_threadtask(thread);
-       init_task_failure_data[0] = 0;
-
 #if CONFIG_MACF
        mac_cred_label_associate_user(p->p_ucred);
 #endif
+
+    vm_init_before_launchd();
+
+
+       bsd_init_kprintf("bsd_do_post - done");
+
        load_init_program(p);
        lock_trace = 1;
 }
@@ -1101,7 +1163,7 @@ bsd_utaskbootstrap(void)
        ut = (struct uthread *)get_bsdthread_info(thread);
        ut->uu_sigmask = 0;
        act_set_astbsd(thread);
-       (void) thread_resume(thread);
+       task_clear_return_wait(get_threadtask(thread));
 }
 
 static void
@@ -1119,6 +1181,20 @@ parse_bsd_args(void)
        if (PE_parse_boot_argn("-x", namep, sizeof (namep))) /* safe boot */
                boothowto |= RB_SAFEBOOT;
 
+       if (PE_parse_boot_argn("-minimalboot", namep, sizeof(namep))) {
+               /*
+                * -minimalboot indicates that we want userspace to be bootstrapped to a
+                * minimal environment.  What constitutes minimal is up to the bootstrap
+                * process.
+                */
+               minimalboot = 1;
+       }
+
+#if __arm64__
+       /* disable 64 bit grading */
+       if (PE_parse_boot_argn("-no64exec", namep, sizeof (namep)))
+               bootarg_no64exec = 1;
+#endif
 
        /* disable vnode_cache_is_authorized() by setting vnode_cache_defeat */
        if (PE_parse_boot_argn("-vnode_cache_defeat", namep, sizeof (namep)))
@@ -1143,11 +1219,59 @@ parse_bsd_args(void)
 
        if (PE_parse_boot_argn("msgbuf", &msgbuf, sizeof (msgbuf))) {
                log_setsize(msgbuf);
+               oslog_setsize(msgbuf);
        }
 
        if (PE_parse_boot_argn("-novfscache", namep, sizeof(namep))) {
                nc_disabled = 1;
        }
+
+#if CONFIG_JETSAM && (DEVELOPMENT || DEBUG)
+       if (PE_parse_boot_argn("-no_vnode_jetsam", namep, sizeof(namep)))
+                bootarg_no_vnode_jetsam = 1;
+#endif /* CONFIG_JETSAM && (DEVELOPMENT || DEBUG) */
+
+
+#if CONFIG_EMBEDDED
+       /*
+        * The darkboot flag is specified by the bootloader and is stored in
+        * boot_args->bootFlags. This flag is available starting revision 2.
+        */
+       boot_args *args = (boot_args *) PE_state.bootArgs;
+       if ((args != NULL) && (args->Revision >= kBootArgsRevision2)) {
+               darkboot = (args->bootFlags & kBootFlagsDarkBoot) ? 1 : 0;
+       } else {
+               darkboot = 0;
+       }
+#endif
+
+#if PROC_REF_DEBUG
+       if (PE_parse_boot_argn("-disable_procref_tracking", namep, sizeof(namep))) {
+               proc_ref_tracking_disabled = 1;
+       }
+#endif
+
+#if OS_REASON_DEBUG
+       if (PE_parse_boot_argn("-disable_osreason_debug", namep, sizeof(namep))) {
+               os_reason_debug_disabled = 1;
+       }
+#endif
+
+       PE_parse_boot_argn("sigrestrict", &sigrestrict_arg, sizeof(sigrestrict_arg));
+
+#if DEVELOPMENT|| DEBUG
+       if (PE_parse_boot_argn("-no_sigsys", namep, sizeof(namep))) {
+               send_sigsys = false;
+       }
+#endif
+
+#if (DEVELOPMENT|| DEBUG)
+       if (PE_parse_boot_argn("alt-dyld", dyld_alt_path, sizeof(dyld_alt_path))) {
+        if (strlen(dyld_alt_path) > 0) {
+            use_alt_dyld = 1;
+        }
+       }
+#endif
 }
 
 void