Cách thực hiện: Giảm thư rác bằng bộ lọc SpamAssassin Bayesian trong cPanel

0

1. Giới thiệu

Mặc dù bài viết này nhằm trình bày cách đào tạo và sử dụng bộ lọc Bayesian trên các trang web được lưu trữ trên cPanel, nhưng bạn có thể sử dụng thông tin trong kỹ thuật này ở bất cứ nơi nào SpamAssassin và fetchmail được cài đặt.

2. Yêu cầu

 • SpamAssassin
 • Lập lịch cron trong cPanel
 • Trình quản lý File trong cPanel
 • Fetchmail phải được cài đặt và sử dụng được trên máy chủ được lưu trữ của bạn

3. SpamAssassin

SpamAssassin kiểm tra các email được gửi đến tài khoản email của bạn để tìm các dấu hiệu cho thấy email đó là thư rác. Nó có một số chữ ký mà nó tìm kiếm và mỗi chữ ký này có thể được cho một trọng số, điều này dẫn đến việc email có “điểm” thư rác. Nếu điểm vượt quá ngưỡng, email được coi là thư rác. Có một số hành động có thể được thực hiện nếu email được chỉ định là thư rác, một trong số đó là thay đổi dòng Chủ đề của email để phản ánh đó là thư rác để có thể xác định quy tắc trong ứng dụng email của bạn để tự động xóa email hoặc di chuyển nó vào một thư mục email rác.

4. Bộ lọc Bayes

Bộ lọc Bayesian là một phương pháp mà SpamAssassin có thể sử dụng để tìm hiểu thêm về các loại email bạn nhận được và do đó có thể nâng cao khả năng xác định email nào là thư rác và email nào không. Điều này cũng giúp giảm số lượng dương tính giả, trong đó một email bị đánh dấu là thư rác khi nó không nên như vậy.

Các bộ lọc này hoạt động bằng cách xác định các thành phần chính của email phổ biến đối với thư rác và những thành phần phổ biến đối với email không phải thư rác. Để đạt được điều này, các bộ lọc phải được cung cấp một mẫu của cả hai để học hỏi và yêu cầu tối thiểu 200 email spam và 200 email không phải spam.

5. Trình đào tạo SpamAssassin cho thư rác và không thư rác mỗi ngày một lần.

 • Điều hướng đến các công việc Cron trong cPanel
 • Nhấp vào Nâng cao
 • Mỗi khi cron chạy, nó có thể gửi email cho quản trị viên để báo cáo kết quả của từng tác vụ. Nhập địa chỉ email thích hợp vào ô được cung cấp
 • Trước tiên, chúng tôi muốn SpamAssassin đào tạo để không phải spam, vì vậy hãy đặt thời gian mà bạn muốn tác vụ này chạy bằng cách nhập số phút của thời gian vào ô đầu tiên và giờ vào ô thứ hai. Vì vậy, để nhiệm vụ đào tạo không có thư rác chạy lúc 1:30 sáng, hãy nhập 30 vào cột phút và 1 vào cột giờ. Lệnh để chạy tác vụ đào tạo không phải thư rác là:=

fetchmail -v -u spam+mydomain.com -a -n –folder nonspam 127.0.0.1 -m ‘sa-learn –ham –siteconfigpath /usr/share/spamassassin’

 • Mục tiếp theo sẽ yêu cầu SpamAssassin đào tạo thư rác. Nhập thời gian muộn hơn vào trường phút và giờ, chẳng hạn như 35 cho một phút và 1 cho một giờ, để lệnh chạy lúc 1:35 sáng. Lệnh huấn luyện thư rác là:

fetchmail -v -u spam+mydomain.com -a -n 127.0.0.1 -m ‘sa-learn –spam –siteconfigpath /usr/share/spamassassin’

Màn hình cron sẽ giống như sau:

6. Cung cấp email đào tạo

Để cung cấp email, trước tiên bạn phải truy cập vào tài khoản email spam trong ứng dụng email ưu tiên của mình. Làm theo hướng dẫn dành cho ứng dụng email của bạn để truy cập tài khoản email IMAP, sử dụng tên tài khoản và mật khẩu bạn đã chọn ở trên. Khi bạn đã tạo và truy cập tài khoản, bạn sẽ thấy các thư mục Hộp thư đến và thư rác. Sao chép 200 email rác vào hộp thư đến và 200 email không phải thư rác vào thư mục không phải thư rác. Lần tới khi các công việc định kỳ được lên lịch thực thi, SpamAssassin sẽ tạo một cơ sở dữ liệu từ những email đó mà nó sẽ sử dụng để xác định xem có bất kỳ email nào trong tương lai là thư rác hay không.

7. Quản lý liên tục

Bất kỳ email nào được xác định là thư rác sẽ được đánh dấu là như vậy với SPAM trong dòng chủ đề. Bạn có thể sử dụng quy tắc hoặc bộ lọc trong ứng dụng email của mình để tự động xử lý những email này, có thể bằng cách đặt chúng vào một thư mục mà nội dung của chúng sẽ tự động bị xóa sau một khoảng thời gian xác định.

SpamAssassin trở nên tốt hơn với nhiều dữ liệu hơn mà nó phải xử lý và do đó, theo thời gian, bạn sẽ nhận được thông báo sai, trong đó một email được phân loại là thư rác mà lẽ ra không nên có. Nếu điều này xảy ra, hãy sao chép email vào thư mục không phải thư rác của tài khoản thư rác và SpamAssassin sẽ cập nhật cơ sở dữ liệu “không thư rác” của nó. Tương tự như vậy, một số thư rác sẽ không được xác định và chúng sẽ được sao chép vào hộp thư đến của tài khoản thư rác.

8. Xử lý sự cố

Hầu hết các vấn đề có thể gặp phải khi sử dụng phương pháp này để đào tạo SpamAssassin có thể được chẩn đoán bằng cách xem lại email nhận được từ công việc định kỳ. Chúng thường liên quan đến quá trình tìm nạp thư được thực thi thông qua cron:

 • Tệp cấu hình chung của SpamAssassin không có tại /usr/share/spamassassin. Kiểm tra với nhà cung cấp dịch vụ lưu trữ của bạn về vị trí của nó
 • Fetchmail chưa được cài đặt. Hỏi nhà cung cấp dịch vụ lưu trữ của bạn nếu nó có thể được cài đặt.
 • Email không có điểm thư rác Bayesian. Điều này thường là do SpamAssassin không được cung cấp đủ email để xây dựng hồ sơ về những gì là và không phải là thư rác. Kiểm tra xem các thư mục hộp thư đến và không phải thư rác có được dọn sạch mỗi ngày không và bạn đã cung cấp 200 mẫu cho từng loại email chưa

Leave a Reply

Your email address will not be published. Required fields are marked *