# 用于将标签转化为两个字的特殊标签,方便做mask language model相关任务 label_des2tag={ "材料科学与工程":"材料", "作物学":"作物", "口腔医学":"口腔", "药学":"药学", "教育学":"教育", "水利工程":"水利", "理论经济学":"理经", "食品科学与工程":"食品", "畜牧学/兽医学":"兽医", "体育学":"体育", "核科学与技术":"核能", "力学":"力学", "园艺学":"园艺", "水产":"水产", "法学":"法学", "地质学/地质资源与地质工程":"地质", "石油与天然气工程":"能源", "农林经济管理":"农林", "信息与通信工程":"通信", "图书馆、情报与档案管理":"情报", "政治学":"政治", "电气工程":"电气", "海洋科学":"海洋", "民族学":"民族", "航空宇航科学与技术":"航空", "化学/化学工程与技术":"化工", "哲学":"哲学", "公共卫生与预防医学":"卫生", "艺术学":"艺术", "农业工程":"农工", "船舶与海洋工程":"船舶", "计算机科学与技术":"计科", "冶金工程":"冶金", "交通运输工程":"交通", "动力工程及工程热物理":"动力", "纺织科学与工程":"纺织", "建筑学":"建筑", "环境科学与工程":"环境", "公共管理":"公管", "数学":"数学", "物理学":"物理", "林学/林业工程":"林业", "心理学":"心理", "历史学":"历史", "工商管理":"工商", "应用经济学":"应经", "中医学/中药学":"中医", "天文学":"天文", "机械工程":"机械", "土木工程":"土木", "光学工程":"光学", "地理学":"地理", "农业资源利用":"农资", "生物学/生物科学与工程":"生物", "兵器科学与技术":"兵器", "矿业工程":"矿业", "大气科学":"大气", "基础医学/临床医学":"医学", "电子科学与技术":"电子", "测绘科学与技术":"测绘", "控制科学与工程":"控制", "军事学":"军事", "中国语言文学":"语言", "新闻传播学":"新闻", "社会学":"社会", "地球物理学":"地球", "植物保护":"植物" } label_des2tag_reverse={v:k for k,v in label_des2tag.items()} label_twoword_list=[v for k,v in label_des2tag.items()] print("label_twoword_list:",label_twoword_list,len(label_twoword_list)) # labeltwoword2index_dict={x:index for index,x in enumerate(label_twoword_list)} # print("labeltwoword2index_dict:",labeltwoword2index_dict) label2index_dict={label_des2tag_reverse[x]:index for index,x in enumerate(label_twoword_list)} print("label2index_dict:",label2index_dict,len(label2index_dict))