chinese_llama_vicuna_tokenizer/config.json

{
  "_name_or_path": "decapoda-research/llama-7b-hf",
  "architectures": [
    "LLaMAForCausalLM"
  ],
  "bos_token_id": 0,
  "eos_token_id": 1,
  "hidden_act": "silu",
  "hidden_size": 4096,
  "initializer_range": 0.02,
  "intermediate_size": 11008,
  "max_position_embeddings": 2048,
  "max_sequence_length": 2048,
  "model_type": "llama",
  "num_attention_heads": 32,
  "num_hidden_layers": 32,
  "pad_token_id": -1,
  "rms_norm_eps": 1e-06,
  "tie_word_embeddings": false,
  "torch_dtype": "float16",
  "transformers_version": "4.29.2",
  "use_cache": true,
  "vocab_size": 32000
}
add preprocessor 2023-06-08 10:45:26 +00:00			`{`
fix wrong tokenizer 2023-06-08 11:02:11 +00:00			`"_name_or_path": "decapoda-research/llama-7b-hf",`
add preprocessor 2023-06-08 10:45:26 +00:00			`"architectures": [`
fix wrong tokenizer 2023-06-08 11:02:11 +00:00			`"LLaMAForCausalLM"`
add preprocessor 2023-06-08 10:45:26 +00:00			`],`
fix wrong tokenizer 2023-06-08 11:02:11 +00:00			`"bos_token_id": 0,`
			`"eos_token_id": 1,`
			`"hidden_act": "silu",`
add preprocessor 2023-06-08 10:45:26 +00:00			`"hidden_size": 4096,`
fix wrong tokenizer 2023-06-08 11:02:11 +00:00			`"initializer_range": 0.02,`
			`"intermediate_size": 11008,`
			`"max_position_embeddings": 2048,`
add preprocessor 2023-06-08 10:45:26 +00:00			`"max_sequence_length": 2048,`
fix wrong tokenizer 2023-06-08 11:02:11 +00:00			`"model_type": "llama",`
add preprocessor 2023-06-08 10:45:26 +00:00			`"num_attention_heads": 32,`
fix wrong tokenizer 2023-06-08 11:02:11 +00:00			`"num_hidden_layers": 32,`
			`"pad_token_id": -1,`
			`"rms_norm_eps": 1e-06,`
			`"tie_word_embeddings": false,`
add preprocessor 2023-06-08 10:45:26 +00:00			`"torch_dtype": "float16",`
			`"transformers_version": "4.29.2",`
			`"use_cache": true,`
fix wrong tokenizer 2023-06-08 11:02:11 +00:00			`"vocab_size": 32000`
add preprocessor 2023-06-08 10:45:26 +00:00			`}`