简体中文语料,拿来训练ChatGPT大语言模型,到底是不是垃圾?