Index

Symbols | C

Symbols

--auto_update_redundancy_expert
- command line option
--batch_max_tokens
- command line option
--cache_capacity
- command line option
--chunked_prefill_size
- command line option
--config_server_host
- command line option
--config_server_port
- command line option
--disable_aggressive_schedule
- command line option
--disable_chunked_prefill
- command line option
--disable_cudagraph
- command line option
--disable_custom_allreduce
- command line option
--disable_dynamic_prompt_cache
- command line option
--disable_log_stats
- command line option
--diverse_mode
- command line option
--dp
- command line option
--enable_custom_allgather
- command line option
--enable_decode_microbatch_overlap
- command line option
--enable_fa3
- command line option
--enable_flashinfer_decode
- command line option
--enable_flashinfer_prefill
- command line option
--enable_monitor_auth
- command line option
--enable_mps
- command line option
--enable_multimodal
- command line option
--enable_multimodal_audio
- command line option
--enable_prefill_microbatch_overlap
- command line option
--enable_tpsp_mix_mode
- command line option
--eos_id
- command line option
--ep_redundancy_expert_config_path
- command line option
--first_token_constraint_mode
- command line option
--graph_grow_step_size
- command line option
--graph_max_batch_size
- command line option
--graph_max_len_in_batch
- command line option
--graph_split_batch_size
- command line option
--grouping_key
- command line option
--health_monitor
- command line option
--host
- command line option
--httpserver_workers
- command line option
--job_name
- command line option
--load_way
- command line option
--log_stats_interval
- command line option
--long_truncation_mode
- command line option
--max_req_total_len
- command line option
--max_total_token_num
- command line option
--mem_fraction
- command line option
--metric_gateway
- command line option

--mode
- command line option
--model_dir
- command line option
--model_name
- command line option
--mtp_draft_model_dir
- command line option
--mtp_mode
- command line option
--mtp_step
- command line option
--multinode_httpmanager_port
- command line option
--multinode_router_gloo_port
- command line option
--nccl_host
- command line option
--nccl_port
- command line option
--nnodes
- command line option
--node_rank
- command line option
--output_constraint_mode
- command line option
--pd_decode_rpyc_port
- command line option
--pd_master_ip
- command line option
--pd_master_port
- command line option
--port
- command line option
--push_interval
- command line option
--quant_cfg
- command line option
--quant_type
- command line option
--return_all_prompt_logprobs
- command line option
--router_max_new_token_len
- command line option
--router_max_wait_tokens
- command line option
--router_token_ratio
- command line option
--run_mode
- command line option
--running_max_req_size
- command line option
--sampling_backend
- command line option
--schedule_time_interval
- command line option
--token_healing_mode
- command line option
--tokenizer_mode
- command line option
--tool_call_parser
- command line option
--tp
- command line option
--trust_remote_code
- command line option
--use_config_server_to_init_nccl
- command line option
--use_reward_model
- command line option
--use_tgi_api
- command line option
--visual_dp
- command line option
--visual_gpu_ids
- command line option
--visual_infer_batch_size
- command line option
--visual_nccl_ports
- command line option
--visual_tp
- command line option
--vit_quant_cfg
- command line option
--vit_quant_type
- command line option
--zmq_mode
- command line option

C

command line option