git.saurik.com Git - apple/xnu.git/blame_incremental

... / ...

Commit	Line	Data
	1	/*
	2	* Copyright (c) 2003-2007 Apple Inc. All rights reserved.
	3	*
	4	* @APPLE_OSREFERENCE_LICENSE_HEADER_START@
	5	*
	6	* This file contains Original Code and/or Modifications of Original Code
	7	* as defined in and that are subject to the Apple Public Source License
	8	* Version 2.0 (the 'License'). You may not use this file except in
	9	* compliance with the License. The rights granted to you under the License
	10	* may not be used to create, or enable the creation or redistribution of,
	11	* unlawful or unlicensed copies of an Apple operating system, or to
	12	* circumvent, violate, or enable the circumvention or violation of, any
	13	* terms of an Apple operating system software license agreement.
	14	*
	15	* Please obtain a copy of the License at
	16	* http://www.opensource.apple.com/apsl/ and read it before using this file.
	17	*
	18	* The Original Code and all software distributed under the License are
	19	* distributed on an 'AS IS' basis, WITHOUT WARRANTY OF ANY KIND, EITHER
	20	* EXPRESS OR IMPLIED, AND APPLE HEREBY DISCLAIMS ALL SUCH WARRANTIES,
	21	* INCLUDING WITHOUT LIMITATION, ANY WARRANTIES OF MERCHANTABILITY,
	22	* FITNESS FOR A PARTICULAR PURPOSE, QUIET ENJOYMENT OR NON-INFRINGEMENT.
	23	* Please see the License for the specific language governing rights and
	24	* limitations under the License.
	25	*
	26	* @APPLE_OSREFERENCE_LICENSE_HEADER_END@
	27	*/
	28	/*
	29	* Kernel stack management routines.
	30	*/
	31
	32	#include <mach/mach_host.h>
	33	#include <mach/mach_types.h>
	34	#include <mach/processor_set.h>
	35
	36	#include <kern/kern_types.h>
	37	#include <kern/mach_param.h>
	38	#include <kern/processor.h>
	39	#include <kern/thread.h>
	40	#include <kern/zalloc.h>
	41	#include <kern/kalloc.h>
	42	#include <kern/ledger.h>
	43
	44	#include <vm/vm_map.h>
	45	#include <vm/vm_kern.h>
	46
	47	#include <mach_debug.h>
	48
	49	/*
	50	* We allocate stacks from generic kernel VM.
	51	*
	52	* The stack_free_list can only be accessed at splsched,
	53	* because stack_alloc_try/thread_invoke operate at splsched.
	54	*/
	55
	56	decl_simple_lock_data(static,stack_lock_data)
	57	#define stack_lock() simple_lock(&stack_lock_data)
	58	#define stack_unlock() simple_unlock(&stack_lock_data)
	59
	60	#define STACK_CACHE_SIZE 2
	61
	62	static vm_offset_t stack_free_list;
	63
	64	static unsigned int stack_free_count, stack_free_hiwat; /* free list count */
	65	static unsigned int stack_hiwat;
	66	unsigned int stack_total; /* current total count */
	67	unsigned long long stack_allocs; /* total count of allocations */
	68
	69	static int stack_fake_zone_index = -1; /* index in zone_info array */
	70
	71	static unsigned int stack_free_target;
	72	static int stack_free_delta;
	73
	74	static unsigned int stack_new_count; /* total new stack allocations */
	75
	76	static vm_offset_t stack_addr_mask;
	77
	78	unsigned int kernel_stack_pages = KERNEL_STACK_SIZE / PAGE_SIZE;
	79	vm_offset_t kernel_stack_size = KERNEL_STACK_SIZE;
	80	vm_offset_t kernel_stack_mask = -KERNEL_STACK_SIZE;
	81	vm_offset_t kernel_stack_depth_max = 0;
	82
	83	static inline void
	84	STACK_ZINFO_PALLOC(thread_t thread)
	85	{
	86	task_t task;
	87	zinfo_usage_t zinfo;
	88
	89	ledger_credit(thread->t_ledger, task_ledgers.tkm_private, kernel_stack_size);
	90
	91	if (stack_fake_zone_index != -1 &&
	92	(task = thread->task) != NULL && (zinfo = task->tkm_zinfo) != NULL)
	93	OSAddAtomic64(kernel_stack_size,
	94	(int64_t *)&zinfo[stack_fake_zone_index].alloc);
	95	}
	96
	97	static inline void
	98	STACK_ZINFO_PFREE(thread_t thread)
	99	{
	100	task_t task;
	101	zinfo_usage_t zinfo;
	102
	103	ledger_debit(thread->t_ledger, task_ledgers.tkm_private, kernel_stack_size);
	104
	105	if (stack_fake_zone_index != -1 &&
	106	(task = thread->task) != NULL && (zinfo = task->tkm_zinfo) != NULL)
	107	OSAddAtomic64(kernel_stack_size,
	108	(int64_t *)&zinfo[stack_fake_zone_index].free);
	109	}
	110
	111	static inline void
	112	STACK_ZINFO_HANDOFF(thread_t from, thread_t to)
	113	{
	114	ledger_debit(from->t_ledger, task_ledgers.tkm_private, kernel_stack_size);
	115	ledger_credit(to->t_ledger, task_ledgers.tkm_private, kernel_stack_size);
	116
	117	if (stack_fake_zone_index != -1) {
	118	task_t task;
	119	zinfo_usage_t zinfo;
	120
	121	if ((task = from->task) != NULL && (zinfo = task->tkm_zinfo) != NULL)
	122	OSAddAtomic64(kernel_stack_size,
	123	(int64_t *)&zinfo[stack_fake_zone_index].free);
	124
	125	if ((task = to->task) != NULL && (zinfo = task->tkm_zinfo) != NULL)
	126	OSAddAtomic64(kernel_stack_size,
	127	(int64_t *)&zinfo[stack_fake_zone_index].alloc);
	128	}
	129	}
	130
	131	/*
	132	* The next field is at the base of the stack,
	133	* so the low end is left unsullied.
	134	*/
	135	#define stack_next(stack) \
	136	(((vm_offset_t )((stack) + kernel_stack_size) - 1))
	137
	138	static inline int
	139	log2(vm_offset_t size)
	140	{
	141	int result;
	142	for (result = 0; size > 0; result++)
	143	size >>= 1;
	144	return result;
	145	}
	146
	147	static inline vm_offset_t
	148	roundup_pow2(vm_offset_t size)
	149	{
	150	return 1UL << (log2(size - 1) + 1);
	151	}
	152
	153	static vm_offset_t stack_alloc_internal(void);
	154	static void stack_free_stack(vm_offset_t);
	155
	156	void
	157	stack_init(void)
	158	{
	159	simple_lock_init(&stack_lock_data, 0);
	160
	161	if (PE_parse_boot_argn("kernel_stack_pages",
	162	&kernel_stack_pages,
	163	sizeof (kernel_stack_pages))) {
	164	kernel_stack_size = kernel_stack_pages * PAGE_SIZE;
	165	printf("stack_init: kernel_stack_pages=%d kernel_stack_size=%p\n",
	166	kernel_stack_pages, (void *) kernel_stack_size);
	167	}
	168
	169	if (kernel_stack_size < round_page(kernel_stack_size))
	170	panic("stack_init: stack size %p not a multiple of page size %d\n",
	171	(void *) kernel_stack_size, PAGE_SIZE);
	172
	173	stack_addr_mask = roundup_pow2(kernel_stack_size) - 1;
	174	kernel_stack_mask = ~stack_addr_mask;
	175	}
	176
	177	/*
	178	* stack_alloc:
	179	*
	180	* Allocate a stack for a thread, may
	181	* block.
	182	*/
	183
	184	static vm_offset_t
	185	stack_alloc_internal(void)
	186	{
	187	vm_offset_t stack;
	188	spl_t s;
	189	int guard_flags;
	190
	191	s = splsched();
	192	stack_lock();
	193	stack_allocs++;
	194	stack = stack_free_list;
	195	if (stack != 0) {
	196	stack_free_list = stack_next(stack);
	197	stack_free_count--;
	198	}
	199	else {
	200	if (++stack_total > stack_hiwat)
	201	stack_hiwat = stack_total;
	202	stack_new_count++;
	203	}
	204	stack_free_delta--;
	205	stack_unlock();
	206	splx(s);
	207
	208	if (stack == 0) {
	209
	210	/*
	211	* Request guard pages on either side of the stack. Ask
	212	* kernel_memory_allocate() for two extra pages to account
	213	* for these.
	214	*/
	215
	216	guard_flags = KMA_GUARD_FIRST \| KMA_GUARD_LAST;
	217	if (kernel_memory_allocate(kernel_map, &stack,
	218	kernel_stack_size + (2*PAGE_SIZE),
	219	stack_addr_mask,
	220	KMA_KSTACK \| KMA_KOBJECT \| guard_flags)
	221	!= KERN_SUCCESS)
	222	panic("stack_alloc: kernel_memory_allocate");
	223
	224	/*
	225	* The stack address that comes back is the address of the lower
	226	* guard page. Skip past it to get the actual stack base address.
	227	*/
	228
	229	stack += PAGE_SIZE;
	230	}
	231	return stack;
	232	}
	233
	234	void
	235	stack_alloc(
	236	thread_t thread)
	237	{
	238
	239	assert(thread->kernel_stack == 0);
	240	machine_stack_attach(thread, stack_alloc_internal());
	241	STACK_ZINFO_PALLOC(thread);
	242	}
	243
	244	void
	245	stack_handoff(thread_t from, thread_t to)
	246	{
	247	assert(from == current_thread());
	248	machine_stack_handoff(from, to);
	249	STACK_ZINFO_HANDOFF(from, to);
	250	}
	251
	252	/*
	253	* stack_free:
	254	*
	255	* Detach and free the stack for a thread.
	256	*/
	257	void
	258	stack_free(
	259	thread_t thread)
	260	{
	261	vm_offset_t stack = machine_stack_detach(thread);
	262
	263	assert(stack);
	264	if (stack != thread->reserved_stack) {
	265	STACK_ZINFO_PFREE(thread);
	266	stack_free_stack(stack);
	267	}
	268	}
	269
	270	void
	271	stack_free_reserved(
	272	thread_t thread)
	273	{
	274	if (thread->reserved_stack != thread->kernel_stack) {
	275	stack_free_stack(thread->reserved_stack);
	276	STACK_ZINFO_PFREE(thread);
	277	}
	278	}
	279
	280	static void
	281	stack_free_stack(
	282	vm_offset_t stack)
	283	{
	284	struct stack_cache *cache;
	285	spl_t s;
	286
	287	s = splsched();
	288	cache = &PROCESSOR_DATA(current_processor(), stack_cache);
	289	if (cache->count < STACK_CACHE_SIZE) {
	290	stack_next(stack) = cache->free;
	291	cache->free = stack;
	292	cache->count++;
	293	}
	294	else {
	295	stack_lock();
	296	stack_next(stack) = stack_free_list;
	297	stack_free_list = stack;
	298	if (++stack_free_count > stack_free_hiwat)
	299	stack_free_hiwat = stack_free_count;
	300	stack_free_delta++;
	301	stack_unlock();
	302	}
	303	splx(s);
	304	}
	305
	306	/*
	307	* stack_alloc_try:
	308	*
	309	* Non-blocking attempt to allocate a
	310	* stack for a thread.
	311	*
	312	* Returns TRUE on success.
	313	*
	314	* Called at splsched.
	315	*/
	316	boolean_t
	317	stack_alloc_try(
	318	thread_t thread)
	319	{
	320	struct stack_cache *cache;
	321	vm_offset_t stack;
	322
	323	cache = &PROCESSOR_DATA(current_processor(), stack_cache);
	324	stack = cache->free;
	325	if (stack != 0) {
	326	STACK_ZINFO_PALLOC(thread);
	327	cache->free = stack_next(stack);
	328	cache->count--;
	329	}
	330	else {
	331	if (stack_free_list != 0) {
	332	stack_lock();
	333	stack = stack_free_list;
	334	if (stack != 0) {
	335	STACK_ZINFO_PALLOC(thread);
	336	stack_free_list = stack_next(stack);
	337	stack_free_count--;
	338	stack_free_delta--;
	339	}
	340	stack_unlock();
	341	}
	342	}
	343
	344	if (stack != 0 \|\| (stack = thread->reserved_stack) != 0) {
	345	machine_stack_attach(thread, stack);
	346	return (TRUE);
	347	}
	348
	349	return (FALSE);
	350	}
	351
	352	static unsigned int stack_collect_tick, last_stack_tick;
	353
	354	/*
	355	* stack_collect:
	356	*
	357	* Free excess kernel stacks, may
	358	* block.
	359	*/
	360	void
	361	stack_collect(void)
	362	{
	363	if (stack_collect_tick != last_stack_tick) {
	364	unsigned int target;
	365	vm_offset_t stack;
	366	spl_t s;
	367
	368	s = splsched();
	369	stack_lock();
	370
	371	target = stack_free_target + (STACK_CACHE_SIZE * processor_count);
	372	target += (stack_free_delta >= 0)? stack_free_delta: -stack_free_delta;
	373
	374	while (stack_free_count > target) {
	375	stack = stack_free_list;
	376	stack_free_list = stack_next(stack);
	377	stack_free_count--; stack_total--;
	378	stack_unlock();
	379	splx(s);
	380
	381	/*
	382	* Get the stack base address, then decrement by one page
	383	* to account for the lower guard page. Add two extra pages
	384	* to the size to account for the guard pages on both ends
	385	* that were originally requested when the stack was allocated
	386	* back in stack_alloc().
	387	*/
	388
	389	stack = (vm_offset_t)vm_map_trunc_page(
	390	stack,
	391	VM_MAP_PAGE_MASK(kernel_map));
	392	stack -= PAGE_SIZE;
	393	if (vm_map_remove(
	394	kernel_map,
	395	stack,
	396	stack + kernel_stack_size+(2*PAGE_SIZE),
	397	VM_MAP_REMOVE_KUNWIRE)
	398	!= KERN_SUCCESS)
	399	panic("stack_collect: vm_map_remove");
	400	stack = 0;
	401
	402	s = splsched();
	403	stack_lock();
	404
	405	target = stack_free_target + (STACK_CACHE_SIZE * processor_count);
	406	target += (stack_free_delta >= 0)? stack_free_delta: -stack_free_delta;
	407	}
	408
	409	last_stack_tick = stack_collect_tick;
	410
	411	stack_unlock();
	412	splx(s);
	413	}
	414	}
	415
	416	/*
	417	* compute_stack_target:
	418	*
	419	* Computes a new target free list count
	420	* based on recent alloc / free activity.
	421	*
	422	* Limits stack collection to once per
	423	* computation period.
	424	*/
	425	void
	426	compute_stack_target(
	427	__unused void *arg)
	428	{
	429	spl_t s;
	430
	431	s = splsched();
	432	stack_lock();
	433
	434	if (stack_free_target > 5)
	435	stack_free_target = (4 * stack_free_target) / 5;
	436	else
	437	if (stack_free_target > 0)
	438	stack_free_target--;
	439
	440	stack_free_target += (stack_free_delta >= 0)? stack_free_delta: -stack_free_delta;
	441
	442	stack_free_delta = 0;
	443	stack_collect_tick++;
	444
	445	stack_unlock();
	446	splx(s);
	447	}
	448
	449	void
	450	stack_fake_zone_init(int zone_index)
	451	{
	452	stack_fake_zone_index = zone_index;
	453	}
	454
	455	void
	456	stack_fake_zone_info(int *count,
	457	vm_size_t cur_size, vm_size_t max_size, vm_size_t elem_size, vm_size_t alloc_size,
	458	uint64_t sum_size, int collectable, int exhaustable, int caller_acct)
	459	{
	460	unsigned int total, hiwat, free;
	461	unsigned long long all;
	462	spl_t s;
	463
	464	s = splsched();
	465	stack_lock();
	466	all = stack_allocs;
	467	total = stack_total;
	468	hiwat = stack_hiwat;
	469	free = stack_free_count;
	470	stack_unlock();
	471	splx(s);
	472
	473	*count = total - free;
	474	cur_size = kernel_stack_size total;
	475	max_size = kernel_stack_size hiwat;
	476	*elem_size = kernel_stack_size;
	477	*alloc_size = kernel_stack_size;
	478	sum_size = all kernel_stack_size;
	479
	480	*collectable = 1;
	481	*exhaustable = 0;
	482	*caller_acct = 1;
	483	}
	484
	485	/* OBSOLETE */
	486	void stack_privilege(
	487	thread_t thread);
	488
	489	void
	490	stack_privilege(
	491	__unused thread_t thread)
	492	{
	493	/* OBSOLETE */
	494	}
	495
	496	/*
	497	* Return info on stack usage for threads in a specific processor set
	498	*/
	499	kern_return_t
	500	processor_set_stack_usage(
	501	processor_set_t pset,
	502	unsigned int *totalp,
	503	vm_size_t *spacep,
	504	vm_size_t *residentp,
	505	vm_size_t *maxusagep,
	506	vm_offset_t *maxstackp)
	507	{
	508	#if !MACH_DEBUG
	509	return KERN_NOT_SUPPORTED;
	510	#else
	511	unsigned int total;
	512	vm_size_t maxusage;
	513	vm_offset_t maxstack;
	514
	515	register thread_t *thread_list;
	516	register thread_t thread;
	517
	518	unsigned int actual; /* this many things */
	519	unsigned int i;
	520
	521	vm_size_t size, size_needed;
	522	void *addr;
	523
	524	if (pset == PROCESSOR_SET_NULL \|\| pset != &pset0)
	525	return KERN_INVALID_ARGUMENT;
	526
	527	size = 0;
	528	addr = NULL;
	529
	530	for (;;) {
	531	lck_mtx_lock(&tasks_threads_lock);
	532
	533	actual = threads_count;
	534
	535	/* do we have the memory we need? */
	536
	537	size_needed = actual * sizeof(thread_t);
	538	if (size_needed <= size)
	539	break;
	540
	541	lck_mtx_unlock(&tasks_threads_lock);
	542
	543	if (size != 0)
	544	kfree(addr, size);
	545
	546	assert(size_needed > 0);
	547	size = size_needed;
	548
	549	addr = kalloc(size);
	550	if (addr == 0)
	551	return KERN_RESOURCE_SHORTAGE;
	552	}
	553
	554	/* OK, have memory and list is locked */
	555	thread_list = (thread_t *) addr;
	556	for (i = 0, thread = (thread_t)(void *) queue_first(&threads);
	557	!queue_end(&threads, (queue_entry_t) thread);
	558	thread = (thread_t)(void *) queue_next(&thread->threads)) {
	559	thread_reference_internal(thread);
	560	thread_list[i++] = thread;
	561	}
	562	assert(i <= actual);
	563
	564	lck_mtx_unlock(&tasks_threads_lock);
	565
	566	/* calculate maxusage and free thread references */
	567
	568	total = 0;
	569	maxusage = 0;
	570	maxstack = 0;
	571	while (i > 0) {
	572	thread_t threadref = thread_list[--i];
	573
	574	if (threadref->kernel_stack != 0)
	575	total++;
	576
	577	thread_deallocate(threadref);
	578	}
	579
	580	if (size != 0)
	581	kfree(addr, size);
	582
	583	*totalp = total;
	584	residentp = spacep = total * round_page(kernel_stack_size);
	585	*maxusagep = maxusage;
	586	*maxstackp = maxstack;
	587	return KERN_SUCCESS;
	588
	589	#endif /* MACH_DEBUG */
	590	}
	591
	592	vm_offset_t min_valid_stack_address(void)
	593	{
	594	return (vm_offset_t)vm_map_min(kernel_map);
	595	}
	596
	597	vm_offset_t max_valid_stack_address(void)
	598	{
	599	return (vm_offset_t)vm_map_max(kernel_map);
	600	}