日日操夜夜添-日日操影院-日日草夜夜操-日日干干-精品一区二区三区波多野结衣-精品一区二区三区高清免费不卡

公告:魔扣目錄網為廣大站長提供免費收錄網站服務,提交前請做好本站友鏈:【 網站目錄:http://www.ylptlb.cn 】, 免友鏈快審服務(50元/站),

點擊這里在線咨詢客服
新站提交
  • 網站:51998
  • 待審:31
  • 小程序:12
  • 文章:1030137
  • 會員:747

本文講述如何查找數據庫里重復的行。這是初學者十分普遍遇到的問題。方法也很簡單。這個問題還可以有其他演變,例如,如何查找“兩字段重復的行”(#MySQL IRC 頻道問到的問題)

如何查找重復行

第一步是定義什么樣的行才是重復行。多數情況下很簡單:它們某一列具有相同的值。本文采用這一定義,或許你對“重復”的定義比這復雜,你需要對sql做些修改。本文要用到的數據樣本:

create table test(id int not primary key, day date not null);  insert into test(id, day) values(1, '2006-10-08');  insert into test(id, day) values(2, '2006-10-08');  insert into test(id, day) values(3, '2006-10-09');  select * from test;  +----+------------+  | id | day     |  +----+------------+  |  1 | 2006-10-08 |  |  2 | 2006-10-08 |  |  3 | 2006-10-09 |  +----+------------+

前面兩行在day字段具有相同的值,因此如何我將他們當做重復行,這里有一查詢語句可以查找。查詢語句使用GROUP BY子句把具有相同字段值的行歸為一組,然后計算組的大小。

select day, count(*) from test GROUP BY day;  +------------+----------+  | day     | count(*) |  +------------+----------+  | 2006-10-08 |     2 | | 2006-10-09 |     1 |  +------------+----------+

重復行的組大小大于1。如何希望只顯示重復行,必須使用HAVING子句,比如

select day, count(*) from test group by day HAVING count(*) > 1;  +------------+----------+  | day     | count(*) |  +------------+----------+  | 2006-10-08 |     2 |  +------------+----------+

這是基本的技巧:根據具有相同值的字段分組,然后知顯示大小大于1的組。

為什么不能使用WHERE子句?

因為WHERE子句過濾的是分組之前的行,HAVING子句過濾的是分組之后的行。

如何刪除重復行

一個相關的問題是如何刪除重復行。一個常見的任務是,重復行只保留一行,其他刪除,然后你可以創建適當的索引,防止以后再有重復的行寫入數據庫。

同樣,首先是弄清楚重復行的定義。你要保留的是哪一行呢?第一行,或者某個字段具有最大值的行?本文中,假設要保留的是第一行——id字段具有最小值的行,意味著你要刪除其他的行。

也許最簡單的方法是通過臨時表。尤其對于MYSQL,有些限制是不能在一個查詢語句中select的同時update一個表。簡單起見,這里只用到了臨時表的方法。

我們的任務是:刪除所有重復行,除了分組中id字段具有最小值的行。因此,需要找出大小大于1的分組,以及希望保留的行。你可以使用MIN()函數。這里的語句是創建臨時表,以及查找需要用DELETE刪除的行。

create temporary table to_delete (day date not null, min_id int not null);  insert into to_delete(day, min_id)   select day, MIN(id) from test group by day having count(*) > 1;  select * from to_delete;  +------------+--------+  | day     | min_id |  +------------+--------+  | 2006-10-08 |    1 |  +------------+--------+

有了這些數據,你可以開始刪除“臟數據”行了。可以有幾種方法,各有優劣(詳見我的文章many-to-one problems in SQL),但這里不做詳細比較,只是說明在支持查詢子句的關系數據庫中,使用的標準方法。

delete from test  where exists(     select * from to_delete     where to_delete.day = test.day and to_delete.min_id <> test.id   )

如何查找多列上的重復行

有人最近問到這樣的問題:我的一個表上有兩個字段b和c,分別關聯到其他兩個表的b和c字段。我想要找出在b字段或者c字段上具有重復值的行。

咋看很難明白,通過對話后我理解了:他想要對b和c分別創建unique索引。如上所述,查找在某一字段上具有重復值的行很簡單,只要用group分組,然后計算組的大小。并且查找全部字段重復的行也很簡單,只要把所有字段放到group子句。但如果是判斷b字段重復或者c字段重復,問題困難得多。這里提問者用到的樣本數據

create table a_b_c(   a int not null primary key auto_increment,   b int,   c int );  insert into a_b_c(b,c) values (1, 1);  insert into a_b_c(b,c) values (1, 2);  insert into a_b_c(b,c) values (1, 3);  insert into a_b_c(b,c) values (2, 1);  insert into a_b_c(b,c) values (2, 2);  insert into a_b_c(b,c) values (2, 3);  insert into a_b_c(b,c) values (3, 1);  insert into a_b_c(b,c) values (3, 2);  insert into a_b_c(b,c) values (3, 3);

現在,你可以輕易看到表里面有一些重復的行,但找不到兩行具有相同的二元組{b, c}。這就是為什么問題會變得困難了。

分享到:
標簽:MySQL
用戶無頭像

網友整理

注冊時間:

網站:5 個   小程序:0 個  文章:12 篇

  • 51998

    網站

  • 12

    小程序

  • 1030137

    文章

  • 747

    會員

趕快注冊賬號,推廣您的網站吧!
最新入駐小程序

數獨大挑戰2018-06-03

數獨一種數學游戲,玩家需要根據9

答題星2018-06-03

您可以通過答題星輕松地創建試卷

全階人生考試2018-06-03

各種考試題,題庫,初中,高中,大學四六

運動步數有氧達人2018-06-03

記錄運動步數,積累氧氣值。還可偷

每日養生app2018-06-03

每日養生,天天健康

體育訓練成績評定2018-06-03

通用課目體育訓練成績評定