# 导入pandas库,并将其重命名为pd
import pandas as pd

# 设置pandas显示的宽度,以便更好地查看数据(每行最多300个字符)
pd.set_option("display.width", 300)
# 设置pandas显示的最大行数,以便显示所有行(不限制行数)
pd.set_option("display.max_rows", None)
# 设置pandas显示的最大列数,以便显示所有列(不限制列数)
pd.set_option("display.max_columns", None)

# 从'Nowcoder1.csv'文件中读取数据,使用逗号作为分隔符,并将数据存储在名为nowcoder_1的DataFrame中
nowcoder_1 = pd.read_csv('Nowcoder1.csv', sep=',')
# 从'Nowcoder2.csv'文件中读取数据,使用逗号作为分隔符,并将数据存储在名为nowcoder_2的DataFrame中
nowcoder_2 = pd.read_csv('Nowcoder2.csv', sep=',')

# 使用'Nowcoder_ID'列将nowcoder_1和nowcoder_2两个DataFrame合并成一个新的DataFrame,使用外连接(outer join)方式
data = pd.merge(nowcoder_1, nowcoder_2, how='outer', on='Nowcoder_ID')

# 选择感兴趣的列,存储在名为column_name的列表中
column_name = ['Name', 'Num_of_exercise', 'Number_of_submissions']
# 从合并后的DataFrame中提取指定的列,存储在名为filter_data的新DataFrame中
filter_data = data[column_name]

# 打印过滤后的数据
print(filter_data)