Sunday, February 21, 2016

Phân tích gian lận với Apache Spark

Nhiều trong số các ứng dụng trực tuyến ngày nay đã phát triển vượt quá truyền thống và cơ bản ACID (atomic, consistent, isolated, durable) của kỷ nguyên quan hệ giao dịch và đã mở rộng để nó có thể được sử dụng trên một hệ thống phân phối rộng rãi, và có nhiều hơn một tương tác khi sự giao dịch có thể bao gồm phân tích thời gian thực (real time) thời gian lân cận (near time) và cả sự kiện trong quá khứ.


Sau khi hoàn thành, sau đó các giao dịch được sử dụng để kích hoạt các sự kiện khác và đưa ra quyết định có ảnh hưởng thật đến giao dịch tiếp theo mà người dùng tạo ra hoặc các hoạt động nội bộ như là các quá trình ra quyết định trong kinh doanh thông minh.





Ví dụ về các ứng dụng ngày càng trở thành phân tích giao dịch bao gồm hệ thống phát hiện gian lận lĩnh vực mà yêu cầu mua đến và phân tích nhiều chi tiết riêng biệt liên quan đến các yêu cầu như vị trí mua, tần suất, số lượng và nhiều hơn nữa. Các trường hợp khác sử dụng thích hợp đối với phân tích giao dịch đó là công cụ khuyến cáo trực tuyến mà liên tục tiêu thụ và phân tích hoạt động người dùng, sau đó nhanh chóng quay lại đưa ra gợi ý về những mặt hàng được đề xuất khác để mua,  bổ sung thêm những tin tức mới, câu chuyện mới để đọc, vân vân.



Nhóm phân tích như Gartner Group phân loại mở rộng những giao dịch pháp lý như phân tích xử lý giao thức lại hay HTAP. Ngoài ra, Gartner cho rằng các phân tích cần thiết trong rất nhiều các ứng dụng sẽ được đa dạng "nhịp độ", có nghĩ là tốc độ mà tại đó các phân tích được thực hiện đôi khi sẽ cần phải là real/near (thực/gần) thời gian thực trong khi tình huống khác sẽ được xử lý tốt nhất bởi phân tích điều này mất nhiều thời gian để thực hiện.



DataStax Enterprise cung cấp xây dựng hợp nhất với Spark để cung cấp sự cần thiết cho phân tích giao dịch. Trong hội nghị thượng đỉnh Cassandra, Pat McDonough, Giám đốc giải pháp khách hàng tại Databricks, đã đưa ra trao đổi xung quanh SDK của tất cả các nền tảng dữ liệu lớn và đi sâu vào Spark cùng sự  hợp lại của nó với Cassandra. Xem video về bài thuyết trình tại đây.



Bạn có thể sử dụng DataStax Enterprise để trải nghiệm phân tích giao dịch, hiểu rõ hơn về cách hoạt động, giao thức và các thức phát hiện gian lận cũng như hiệu suất làm việc của công cụ ứng dụng Spark trong phân tích dữ liệu lớn thời gian thực.


No comments:

Post a Comment

Followers