Cách xóa dữ liệu trùng trong Excel

Khi học Excel hoặc làm việc với các dữ liệu trong bảng tính bị trùng lặp là không thể tránh khỏi. Vậy làm thế nào để bạn có thể loại bỏ được các dữ liệu bị trùng lặp đó mà không phải dùng cách xóa thủ công. Bài viết dưới đây mình sẽ hướng dẫn các bạn cách sử dụng Remove Duplicate để loại bỏ các dữ liệu bị trùng lặp trong Excel nhé.

1. Cách sử dụng Remove duplicate để xóa các nội dung trùng lặp trong Excel

- Bước 1: Bạn bôi đen vùng dữ liệu cần xóa nội dung trùng lặp. Trên thanh công cụ, chọn Data, sau đó chọn Remove Duplicates.


Cách sử dụng remove duplicate trong excel. Hình 1

- Bước 2: Xuất hiện giao diện hộp thoại Remove Duplicates. Bạn lựa chọn các trường có trang bảng để tính năng có thể lọc và phát hiện nội dung trùng lặp. Trong giao diện này, bỏ tích cột STT vì các dòng đều có các số khác nhau. 

Nhấn OK để hoàn thành thao tác. 

Cách sử dụng remove duplicate trong excel. Hình 2

- Bước 3: Giao diện mới sẽ mở ra một bảng thông báo tìm được bao nhiêu giá trị nội dung trùng lặp. 

>> Xem thêm: Cách chèn thêm hàng thêm cột trong Excel đơn giản nhất

2. Ví dụ về cách sử dụng Remove Duplicate trong Excel

Có bảng dữ liệu sau. Excel sẽ xóa tất cả các hàng bị trùng lặp [ô màu xanh]. Tuy nhiên sẽ giữ nguyên hàng trùng lặp đầu tiên [màu vàng]


Cách sử dụng remove duplicate trong excel. Hình 3

Ví dụ: Xóa các hàng có cùng tên và quốc gia

- Bước 1: Chọn DataRemove duplicates. Xuất hiện hộp thoại Remove Duplicates. Sau đó tích chuột chọn Last NameCountry. Sau đó chọn OK.


Cách sử dụng remove duplicate trong excel. Hình 4

Excel sẽ thực hiện xóa tất cả các hàng có cùng tên và quốc gia [ô màu xanh], và trừ các trường hợp đầu tiên được xuất hiện [màu vàng]. Ta được kết quả như hình dưới đây.


Cách sử dụng remove duplicate trong excel. Hình 5

- Ngoài những kiến thức mà Unica đã chia sẻ phía trên, nếu bạn muốn tìm hiểu chi tiết hơn nữa về cách sử dụng của công cụ xử lý dữ liệu Remove Duplicates thì có thể tham khảo Video sau: 

Hướng dẫn công cụ xử lý dữ liệu Remove Duplicate

3. Tìm các dữ liệu trùng lặp trong Excel

- Bước 1: Bôi đen cột dữ liệu bạn muốn tìm ra các dữ liệu trùng lặp

- Bước 2: Chọn Home → Conditional Formatting  Highlight Cells Rules  Duplicate Values.

Tìm dữ liệu trùng lặp trong Excel - Hình 1

- Bước 3: Xuất hiện hộp thoại Duplicate Values. Trong Format Cells that contain chọn Duplicate, Light Red Fill with Dark Red Text [màu vàng, văn bản màu vàng đậm]. Cuối cùng chọn OK.

Tìm dữ liệu trùng lặp trong Excel - Hình 2

- Bước 4: Bạn sẽ thấy sau khi chọn các dữ liệu sẽ có màu vàng

Tìm dữ liệu trùng lặp trong Excel - Hình 3

- Bước 5: Tiến hành lọc các dữ liệu bị trùng nhau. Chọn Filter → Filter by Selected Cell’s Color. 

Tìm dữ liệu trùng lặp trong Excel - Hình 4

- Bước 6: Trong cột Name chọn Filter by Color để thêm các màu tùy chọn.

Tìm dữ liệu trùng lặp trong Excel - Hình 5

- Bước 7: Bây giờ, sau khi chọn màu, bạn sẽ được bảng tính có màu [ví dụ màu vàng như bảng dưới]. Sau đó tiến hành xóa hay lọc các dữ liệu trùng lặp.

Tìm dữ liệu trùng lặp trong Excel - Hình 6

>> Xem thêm: 4 Cách tìm kiếm trong Excel nhanh và chuẩn xác nhất 2022

Trên đây, mình đã hướng dẫn các bạn cách sử dụng remove duplicate để xóa các nội dung trùng lặp trong Excel.

Vậy còn chần chừ gì mà không nhanh tay đăng ký để có cơ hội sở hữu khóa học ngay hôm nay bạn nhé!

Unica gợi ý cho bạn: Khóa học "Làm chủ excel qua 100+ chuyên đề từ cơ bản đến nâng cao"

XEM TRỌN BỘ KHÓA HỌC TẠI ĐÂY

Xem thêm: Trọn bộ tin học văn phòng online giúp tối ưu hiệu suất cá nhân, nâng cao hiệu quả công việc 100%


Tags: Excel

Tôi nghĩ ai trong chúng ta cũng đều gặp phải việc nhận được kết quả kỳ lạ do dữ liệu trùng lặp trong dải ô. Điều này có thể dễ dàng khiến các hàm VLOOKUP cho kết quả sai hay khiến việc tính tổng bị sai. Đừng lo lắng vì có rất nhiều cách để kiểm tra và thậm chí là xóa hàng dữ liệu trùng lặp trong bảng tính Excel của bạn. Hãy thư giãn đi.

CÁCH TÌM DỮ LIỆU TRÙNG LẶP TRONG BẢNG TÍNH

Với cách này, tôi sử dụng hàm COUNTIF để xác định liệu có 2 hay nhiều dữ liệu trong ô bị trùng lặp hay không. Nếu các dữ liệu trùng lặp được tìm thấy, thì các hàng đó được dán nhãn “trùng” [viết tắt của “trùng lặp”], nhưng bạn có thể khiến nhãn đó có bất kỳ từ nào bạn muốn.

CÁCH 2: SỬ DỤNG ĐỊNH DẠNG CÓ ĐIỀU KIỆN

Bạn có biết rằng bạn có thể thiết lập trước định dạng có điều kiện để đánh dấu trùng lặp? Trong một khoảng thời gian dài, tôi không hề biết gì về điều này và tôi vẫn còn nhớ rõ sự hoài nghi về phương pháp đơn giản này. Tôi không nghĩ rằng nó đã có sẵn từ rất lâu! Những gì bạn cần làm đó là đánh dấu dữ liệu trong ô rồi đi đến

Home Ribbon Tab > Conditional Formatting > Highlight Cells Rules > Duplicate Values…

Từ đó, bạn chỉ cần nhấn nút OK khi hộp thoại xuất hiện và bất cứ ô nào trùng lặp đều sẽ được đánh dấu bằng cách tô hết ô bằng màu đỏ. Có hàng ngàn hàng và bạn không muốn phải cuộn xuống từng ô để kiểm tra ô nào có màu đỏ? À thì bạn có thể dễ dàng lọc dữ liệu và xem xem liệu bạn có thể lọc các ô có màu đỏ hay không.

Đây là phương pháp rất tuyệt vời. Cách này có thể nhanh chóng dùng cho dữ liệu để xem xem có bất kỳ sự trùng lặp nào không. Tôi có thói quen sử dụng quá trình này để kiểm tra các cột chứng minh nhân dân của mình. Các cột này là kết quả của hàm VLOOKUP, nên tôi chắc rằng tôi có các giá trị đặc biệt trong cột.

CÁCH 3: SỬ DỤNG LẬP TRÌNH VBA MACRO

Bài viết này sẽ không phải là một bài dành cho các chuyên gia bảng tính thật sự nếu không đề cập đến giải pháp dành cho VBA automator! Dưới đây là một macro nho nhỏ mà tôi đã tổng hợp. Macro này sẽ xác định liệu bạn có bất cứ giá trị trùng lặp nào trong dải ô đã chọn hay không.

Sau khi chạy mã VBA Macro này, bạn sẽ thấy một hộp tin nhắn nói rằng bạn có bao nhiều ô trùng lặp được tìm thấy và nó sẽ hỏi liệu bạn có muốn tô vàng các ô này. Đây sẽ là một sự bổ sung tuyệt vời cho Macro Workbook cá nhân của bạn [dĩ nhiên là tôi đã có mã này rồi!].

Sub SearchForDuplicates[] Dim rng As Range Dim rngFind As Range Dim cell As Range Dim DupAddresses As String Dim SearchList As String Dim Delimiter As String’Setup Variables Set rng = Selection Delimiter = “-;;-“‘Loop through each cell in selection For Each cell In rng.Cells ‘Does cell have value? If cell.Value “” Then ‘Has value been searched for yet? If InStr[1, SearchList, cell.Value & Delimiter] = 0 Then

SearchList = SearchList & cell.Value & Delimiter

Set rngFind = rng.Find[what:=cell.Value, LookIn:=xlValues, _
lookat:=xlWhole, searchdirection:=xlNext]

If Not rngFind Is Nothing Then ‘Record first instance found

FirstAddress = rngFind.Address

‘Find any next instances of value Do Set rngFind = rng.FindNext[rngFind] If rngFind.Address = FirstAddress Then Exit Do DupAddresses = DupAddresses & rngFind.Address & “,”

Loop

End If End If End If

Next cell

‘Report Results If DupAddresses “” Then Set rng = Range[Left[DupAddresses, Len[DupAddresses] – 1]] UserAnswer = MsgBox[rng.Count & ” duplicate values were found,” _ & ” would you like them to be highlighted in yellow?”, vbYesNo] If UserAnswer = vbYes Then rng.Interior.Color = vbYellow Else MsgBox “No duplicate cell values were found”

End If

End Sub

  • Hãy lưu ý rằng mã này không đánh dấu ô đầu tiên có dữ liệu trùng lặp. Chỉ ô thứ hai trở đi mới được đánh dấu.

CÁCH XÓA DỮ LIỆU TRÙNG LẶP KHỎI BẢNG TÍNH CỦA BẠN

Bạn có biết rằng có một nút giúp xóa dữ liệu trùng lặp trên thanh Ribbon không? Đây là một tính năng thật sự tuyệt vời vì nó giúp bạn tiết kiệm rất nhiều thời gian. Những điều bạn cần làm đó là đi đến tab Data trên thanh Ribbon. Bạn có thể nhấp vào nút Remove Duplicates rồi điền vào hộp thoại để xóa các dữ liệu trùng lặp tùy vào nhu cầu của bạn.

Bạn cũng có thể truy cập nút Remove Duplicates bên trong Table Tools – Design Ribbon tab nếu bạn đang thao tác với bảng.

CÁCH 2: SỬ DỤNG LẬP TRÌNH VBA

Mã VBA dưới đây chỉ bạn cách các hàng trùng lặp theo thứ tự trong dải ô được chọn mà không cần phải thay đổi dải ô thành bảng. Đừng lo lắng, nó sẽ hỏi liệu bạn có muốn xóa các ô trùng lặp trước khi xóa vĩnh viễn dữ liệu.

Sub DeleteDuplicates[]

Dim rng As Range Dim rngFind As Range Dim cell As Range Dim DupAddresses As String Dim SearchList As String

Dim Delimiter As String

‘Setup Variables Set rng = Selection

Delimiter = “-;;-“

‘Loop through each cell in selection For Each cell In rng.Columns[1].Cells ‘Does cell have value? If cell.Value “” Then ‘Has value been searched for yet? If InStr[1, SearchList, cell.Value & Delimiter] = 0 Then

SearchList = SearchList & cell.Value & Delimiter

Set rngFind = rng.Find[what:=cell.Value, LookIn:=xlValues, _
lookat:=xlWhole, searchdirection:=xlNext]

If Not rngFind Is Nothing Then ‘Record first instance found

FirstAddress = rngFind.Address

‘Find any next instances of value Do Set rngFind = rng.FindNext[rngFind] If rngFind.Address = FirstAddress Then Exit Do Set rngFind = rngFind.Resize[1, rng.Columns.Count] DupAddresses = DupAddresses & rngFind.Address & “,”

Loop

End If End If End If

Next cell

‘Report Results If DupAddresses “” Then Set rng = Range[Left[DupAddresses, Len[DupAddresses] – 1]]

rng.Select

UserAnswer = MsgBox[rng.Count & ” duplicate values were found,” _ & ” would you like to delete any duplicate rows found?”, vbYesNo] If UserAnswer = vbYes Then Selection.Delete Shift:=xlUp Else MsgBox “No duplicate cell values were found”

End If

End Sub

CÒN PHƯƠNG PHÁP NÀO MÀ TÔI BỎ SÓT KHÔNG?

Còn có phương pháp nào khác trong Excel mà thậm chí còn dễ hơn các phương pháp này không? Bạn có biết cách nào dễ hơn để hoàn thành nhiệm vụ trong VBA macro của tôi không? Tôi muốn nghe ý kiến của bạn và học hỏi kinh nghiệm từ bạn. Hãy bình luận bên dưới nếu bạn có bất cứ cách nào khiến nội dung trong bài viết này tốt hơn!

Nếu bạn thấy tò mò và muốn tìm hiểu nhiều hơn về VBA, bạn tham khảo khóa học  VBA101 – VBA cơ bản dành cho người mới bắt đầu của hệ thống Học Excel Online để có thể học VBA đầy đủ và theo hệ thống. Chi tiết xem tại:

Video liên quan

Chủ Đề