在SQL中刪除重復記錄(多種方法)

2024-07-21 02:11:11

字體：大中小

來源：轉載

供稿：網友

學習sql有一段時間了，發現在我建了一個用來測試的表（沒有建索引）中出現了許多的重復記錄。后來總結了一些刪除重復記錄的方法，在oracle中，可以通過唯一rowid實現刪除重復記錄；還可以建臨時表來實現...這個只提到其中的幾種簡單實用的方法，希望可以和大家分享（以表employee為例）。

sql> desc employee

name null? type
----------------------------------------- -------- ------------------

emp_id number(10)
emp_name varchar2(20)

salary number(10,2)

可以通過下面的語句查詢重復的記錄：

sql> select * from employee;

emp_id emp_name salary

---------- ---------------------------------------- ----------

1 sunshine 10000

2 semon 20000

3 xyz 30000

2 semon 20000

sql> select distinct * from employee;

emp_id emp_name salary

---------- ---------------------------------------- ----------

1 sunshine 10000

2 semon 20000

3 xyz 30000

sql> select * from employee group by emp_id,emp_name,salary having count (*)>1

emp_id emp_name salary

---------- ---------------------------------------- ----------

1 sunshine 10000

2 semon 20000

sql> select * from employee e1

where rowid in (select max(rowid) from employe e2
where e1.emp_id=e2.emp_id and

e1.emp_name=e2.emp_name and e1.salary=e2.salary);

emp_id emp_name salary

---------- ---------------------------------------- ----------

1 sunshine 10000

3 xyz 30000

2 semon 20000

2. 刪除的幾種方法：

（1）通過建立臨時表來實現

sql>create table temp_emp as (select distinct * from employee)

sql> truncate table employee; (清空employee表的數據）

sql> insert into employee select * from temp_emp; (再將臨時表里的內容插回來）

( 2）通過唯一rowid實現刪除重復記錄.在oracle中，每一條記錄都有一個rowid，rowid在整個數據庫中是唯一的，rowid確定了每條記錄是在oracle中的哪一個數據文件、塊、行上。在重復的記錄中，可能所有列的內容都相同，但rowid不會相同，所以只要確定出重復記錄中那些具有最大或最小rowid的就可以了，其余全部刪除。

sql>delete from employee e2 where rowid not in (
select max(e1.rowid) from employee e1 where

e1.emp_id=e2.emp_id and e1.emp_name=e2.emp_name and e1.salary=e2.salary);--這里用min(rowid)也可以。

sql>delete from employee e2 where rowid <(
select max(e1.rowid) from employee e1 where
e1.emp_id=e2.emp_id and e1.emp_name=e2.emp_name and

e1.salary=e2.salary);

（3）也是通過rowid，但效率更高。

sql>delete from employee where rowid not in (
select max(t1.rowid) from employee t1 group by

t1.emp_id,t1.emp_name,t1.salary);--這里用min(rowid)也可以。

emp_id emp_name salary

---------- ---------------------------------------- ----------

1 sunshine 10000

3 xyz 30000

2 semon 20000

sql> desc employee

name null? type
----------------------------------------- -------- ------------------

emp_id number(10)
emp_name varchar2(20)

salary number(10,2)

可以通過下面的語句查詢重復的記錄：

sql> select * from employee;

emp_id emp_name salary

---------- ---------------------------------------- ----------

1 sunshine 10000

2 semon 20000

3 xyz 30000

2 semon 20000

sql> select distinct * from employee;

emp_id emp_name salary

---------- ---------------------------------------- ----------

1 sunshine 10000

2 semon 20000

3 xyz 30000

sql> select * from employee group by emp_id,emp_name,salary having count (*)>1

emp_id emp_name salary

---------- ---------------------------------------- ----------

1 sunshine 10000

2 semon 20000

sql> select * from employee e1

where rowid in (select max(rowid) from employe e2
where e1.emp_id=e2.emp_id and

e1.emp_name=e2.emp_name and e1.salary=e2.salary);

emp_id emp_name salary

---------- ---------------------------------------- ----------

1 sunshine 10000

3 xyz 30000

2 semon 20000

2. 刪除的幾種方法：

（1）通過建立臨時表來實現

sql>create table temp_emp as (select distinct * from employee)

sql> truncate table employee; (清空employee表的數據）

sql> insert into employee select * from temp_emp; (再將臨時表里的內容插回來）

sql>delete from employee e2 where rowid not in (
select max(e1.rowid) from employee e1 where

e1.emp_id=e2.emp_id and e1.emp_name=e2.emp_name and e1.salary=e2.salary);--這里用min(rowid)也可以。

sql>delete from employee e2 where rowid <(
select max(e1.rowid) from employee e1 where
e1.emp_id=e2.emp_id and e1.emp_name=e2.emp_name and