要删除两个Excel表中相同数据的行,你可以使用Python的`pandas`库来实现。以下是一个基本的步骤和代码示例:
1. 你需要安装`pandas`和`openpyxl`(如果还没有安装)。
2. 使用`pandas`读取两个Excel文件。
3. 对比两个DataFrame,找出相同的行。
4. 删除这些相同的行。
5. 将修改后的DataFrame写回新的Excel文件。
下面是具体的代码实现:
```python
import pandas as pd
读取Excel文件
df1 = pd.read_excel('file1.xlsx')
df2 = pd.read_excel('file2.xlsx')
假设我们比较的是两行的所有列
common_rows = df1.merge(df2, indicator=True, how='inner').loc[lambda x: x['_merge'] == 'both'].drop(columns=['_merge'])
删除df1中与df2相同的行
df1 = df1.merge(common_rows, indicator=True, how='outer').loc[lambda x: x['_merge'] != 'both'].drop(columns=['_merge'])
将修改后的df1写回新的Excel文件
df1.to_excel('file1_without_duplicates.xlsx', index=False)
```
这段代码首先读取两个Excel文件到两个DataFrame中,然后使用`merge`函数来找出两个DataFrame中相同的行。这里我们使用`indicator=True`来添加一个名为`_merge`的列,它将指示每行是只存在于`df1`、只存在于`df2`还是两个都存在。然后我们使用这个列来过滤出两个都存在的行,并删除它们。我们将修改后的`df1`写回一个新的Excel文件。
请根据你的具体需求调整列名和文件名。