data warehouse là gì

Data warehouse là gì? Kiến thức cơ phiên bản về kho dữ liệu

Data warehouse nhập vai trò như 1 bộ phận cốt lõi của trí tuệ sale (Business Intelligence), canh ty những công ty nâng lên hiệu suất sinh hoạt. Trong nội dung bài viết ngày hôm nay, Bizfly Cloud sẽ hỗ trợ những kiến thức và kỹ năng tổng quan liêu về Data warehouse giống như Đặc điểm, quyền lợi và những phần mềm của Data warehouse. Cùng lần hiểu nhé!

Data warehouse là gì?

Data warehouse hoặc Kho tài liệu là 1 trong loại khối hệ thống quản lý và vận hành tàng trữ tài liệu được kiến thiết nhằm kích hoạt và tương hỗ những sinh hoạt sale lanh lợi (BI), nhất là phân tách. Data warehouse chỉ nhằm mục đích mục tiêu triển khai những truy vấn và phân tách và thông thường có một lượng rộng lớn tài liệu lịch sử dân tộc. 

Bạn đang xem: data warehouse là gì

Khả năng phân tách của chính nó được cho phép những tổ chức triển khai nhận được những nắm vững sale có mức giá trị kể từ tài liệu của mình nhằm nâng cao việc đi ra ra quyết định. Theo thời hạn, nó kiến thiết một làm hồ sơ lịch sử dân tộc rất có thể là vô giá chỉ so với những ngôi nhà khoa học tập tài liệu và ngôi nhà phân tách sale.  

Khái niệm về Data warehouse vẫn tồn bên trên kể từ trong thời gian 1980, Khi nó được trở nên tân tiến sẽ giúp đỡ quy đổi tài liệu kể từ hỗ trợ tích điện cho những sinh hoạt sang trọng hỗ trợ tích điện cho những khối hệ thống tương hỗ ra quyết định thể hiện tại trí tuệ sale. Data warehouse triệu tập và tổ hợp một lượng rộng lớn tài liệu từ khá nhiều mối cung cấp như tiếp thị, bán sản phẩm, tài chủ yếu, phần mềm nhắm đến quý khách, và những khối hệ thống đối tác chiến lược phía bên ngoài...

Data warehouse là gì? Kiến thức cơ phiên bản về kho tài liệu - Hình ảnh 1.

Ở Lever nghệ thuật, kho tài liệu lịch lấy tài liệu kể từ những phần mềm và khối hệ thống đó; tiếp sau đó, tài liệu trải qua chuyện quy trình định hình và nhập nhằm khớp với tài liệu vẫn sở hữu nhập kho. Data warehouse tàng trữ tài liệu vẫn xử lý này nhằm sẵn sàng mang đến những người dân đi ra ra quyết định truy vấn. Tần suất kéo tài liệu xẩy ra hoặc cơ hội tài liệu được định hình, v.v. tiếp tục không giống nhau tùy nằm trong nhập yêu cầu của tổ chức triển khai.

Đặc điểm chủ yếu của Data warehouse

  • Hướng chủ thể (Subject-Oriented)

Data warehouse hỗ trợ vấn đề đáp ứng cho 1 cửa hàng ví dụ chứ không những sinh hoạt liên tiếp của toàn tổ chức triển khai. Các chủ thể bại liệt rất có thể là bán sản phẩm, tặng thêm, sản phẩm tồn kho,… Ví dụ, nếu như mình thích phân tách tài liệu bán sản phẩm của doanh nghiệp, bạn phải kiến thiết một kho tài liệu triệu tập nhập việc bán sản phẩm. Một kho như thế tiếp tục hỗ trợ những vấn đề có mức giá trị như “ai là quý khách tốt nhất có thể của người tiêu dùng năm ngoái?” hoặc “ai sở hữu năng lực trở nên quý khách tốt nhất có thể của người tiêu dùng nhập năm tới?”

  • Được tích hợp ý (Integrated)

Data warehouse được trở nên tân tiến bằng phương pháp tích hợp ý tài liệu từ khá nhiều mối cung cấp không giống nhau trở thành một định hình nhất quán. Dữ liệu cần được tàng trữ nhập kho một cơ hội nhất quán và được quý khách gật đầu đồng ý về phong thái gọi là, định hình và mã hóa. Vấn đề này tạo ra ĐK mang đến việc phân tách tài liệu hiệu suất cao. 

  • Bất biến chuyển (Non-volatile)

Dữ liệu một Khi được nhập nhập kho tài liệu cần bất biến. Tất cả tài liệu ở cơ chế chỉ hiểu (read-only). Dữ liệu trước bại liệt không xẩy ra xóa Khi nhập tài liệu lúc này. Vấn đề này giúp đỡ bạn phân tách những gì vẫn xẩy ra và lúc nào. Data warehouse tách biệt với hạ tầng tài liệu sinh hoạt, Tức là ngẫu nhiên thay cho thay đổi thông thường xuyên nào là nhập hạ tầng tài liệu sinh hoạt sẽ không còn được phát hiện ra nhập kho tài liệu.

  • Có gán nhãn thời hạn (Time-Variant)

Dữ liệu được tàng trữ nhập Data warehouse hỗ trợ vấn đề kể từ 1 thời điểm lịch sử dân tộc cụ thể; bởi vậy, tài liệu được phân loại với 1 khuông thời hạn ví dụ. Ví dụ về Time-Variant nhập Data warehouse được hiển thị nhập Primary Key sở hữu nguyên tố thời hạn như ngày, tuần hoặc mon.

Đối tượng dùng Data warehouse

Việc dùng Data warehouse là quan trọng đối với:

  • Nhân sự phụ trách đi ra ra quyết định phụ thuộc vào lượng dữ liệu
  • Người dùng những tiến độ phức tạp, tùy chỉnh nhằm tích lũy vấn đề từ khá nhiều mối cung cấp không giống nhau
  • Người mong muốn dùng technology đơn giản và giản dị nhằm truy vấn dữ liệu
  • Người mong muốn sở hữu một cơ hội tiếp cận được khối hệ thống hóa để lấy đi ra quyết định
  • Người mong muốn tăng hiệu suất với lượng tài liệu lớn tưởng cho những report, lưới hoặc biểu đồ
  • Người mong muốn mày mò "các khuôn mẫu ẩn" của luồng tài liệu và nhóm

Kiến trúc của Data warehouse

Kiến trúc của Data warehouse được xác lập dựa vào yêu cầu của công ty. Một số phong cách thiết kế phổ cập của Data warehouse bao gồm:

Simple

Các Data warehouse đều phải có một kiến thiết cơ phiên bản cộng đồng, với siêu tài liệu, tài liệu tóm lược và tài liệu thô được lưu nhập kho tàng trữ trung tâm. Kho tàng trữ được hỗ trợ bởi vì những mối cung cấp tài liệu bên trên một đầu, được người tiêu dùng cuối truy vấn nhằm triển khai phân tách, report và khai quật ở đầu sót lại.

Simple with a staging area

Dữ liệu sinh hoạt cần được thanh lọc tinh khiết và xử lý trước lúc tiến hành kho. Mặc cho dù thao tác này được triển khai theo dõi công tác, nhiều Data warehouse tiếp tục bổ sung cập nhật một vùng phân chia mang đến tài liệu trước lúc tiến hành kho, nhằm mục đích đơn giản và giản dị hóa quy trình sẵn sàng tài liệu.

Hub and spoke

Việc thêm thắt những Data warehouse thân ái kho tàng trữ trung tâm và người tiêu dùng cuối được cho phép công ty tùy chỉnh Data warehouse của mình, nhằm mục đích đáp ứng mang đến nhiều nghành sale không giống nhau. Khi tài liệu vẫn sẵn sàng nhằm dùng, sẽ tiến hành trả cho tới data mart tương thích.

Xem thêm: ml là gì

Sandboxes

Sandboxes là những chống riêng biệt, bảo mật thông tin được cho phép công ty mày mò những cỗ tài liệu mới nhất hoặc cơ hội phân tách tài liệu nhưng mà ko cần thiết tuân hành theo dõi những quy tắc và uỷ thác thức đầu tiên của Data warehouse.

Các loại Data warehouse

Có 3 loại kho tài liệu chính:

Kho tài liệu công ty (EDW - Enterprise Data Warehouse)

Kho tài liệu công ty nhập vai trò là hạ tầng tài liệu chủ yếu hoặc trung tâm tạo ra ĐK tiện lợi mang đến việc đi ra ra quyết định nhập toàn công ty. Các quyền lợi chủ yếu của việc sở hữu EDW bao hàm quyền truy vấn nhập vấn đề liên tổ chức triển khai, năng lực chạy những truy vấn phức tạp và tương hỗ những vấn đề cụ thể đa dạng và phong phú, sở hữu tầm coi xa thẳm để lấy đi ra những ra quyết định dựa vào tài liệu và Reviews khủng hoảng sớm.

Data warehouse là gì? Kiến thức cơ phiên bản về kho tài liệu - Hình ảnh 2.

Kho tài liệu sinh hoạt (ODS - Operational Data Store)

Trong ODS, Data warehouse thực hiện mới nhất theo dõi thời hạn thực. Do bại liệt, những tổ chức triển khai hay sử dụng nó cho những sinh hoạt công ty thường thì, ví dụ như tàng trữ làm hồ sơ của nhân viên cấp dưới. Các tiến độ nhiệm vụ cũng dùng ODS thực hiện mối cung cấp hỗ trợ tài liệu mang đến EDW.

Data mart

Data mart là 1 trong hội tụ con cái của Data warehouse được kiến thiết nhằm lưu giữ một phần tử, chống hoặc đơn vị chức năng sale ví dụ. Mỗi phần tử của công ty đều phải có một kho tàng trữ trung tâm hoặc trung tâm tài liệu nhằm tàng trữ tài liệu. Dữ liệu kể từ data mart được tàng trữ lịch nhập ODS. Sau bại liệt, ODS tiếp tục gửi tài liệu cho tới EDW, điểm nó được tàng trữ và dùng. 

Lợi ích của Data warehouse

Rất nhiều công ty vướng mắc tại vì sao tài liệu tàng trữ là quan trọng. Cách đơn giản và giản dị nhất nhằm phân tích và lý giải điều này là trải qua những quyền lợi không giống nhau cho những người người sử dụng cuối:

  • Cải thiện quyền truy vấn của người tiêu dùng cuối nhập nhiều loại tài liệu doanh nghiệp
  • Tăng tính nhất quán của dữ liệu
  • Tài liệu bổ sung cập nhật về dữ liệu
  • Có năng lực rời ngân sách năng lượng điện toán và tăng năng suất
  • Cung cấp cho một điểm nhằm phối kết hợp tài liệu tương quan kể từ những mối cung cấp riêng biệt biệt
  • Tạo hạ tầng năng lượng điện toán rất có thể tương hỗ những thay cho thay đổi nhập khối hệ thống PC và cấu hình kinh doanh
  • Trao quyền cho những người người sử dụng cuối triển khai những truy vấn hoặc report đặc trưng nhưng mà ko tác động cho tới hiệu suất của khối hệ thống hoạt động

Các doanh nghiệp sở hữu team Data warehouse chuyên sử dụng nổi lên trước những doanh nghiệp không giống trong những nghành đó là trở nên tân tiến thành phầm, định vị, tiếp thị, thời hạn phát hành, phân tách lịch sử dân tộc, dự đoán và sự ưng ý của quý khách. Mặc cho dù Data warehouse rất có thể tương đối tốn thông thường, tuy nhiên về lâu nhiều năm độ quý hiếm mang đến là xứng danh.

Data warehouse là gì? Kiến thức cơ phiên bản về kho tài liệu - Hình ảnh 3.

Ứng dụng của Data Warehouse nhập thực tiễn

Dữ liệu rộng lớn đang trở thành một trong những phần cần thiết trong những công việc triển khai tàng trữ tài liệu và sale lanh lợi nhập một trong những ngành. Hãy nhìn qua một trong những ví dụ về tàng trữ tài liệu trong những nghành không giống nhau coi bại liệt là 1 trong phần quan trọng nhất nhập sinh hoạt hằng ngày của mình.

  • Lĩnh vực góp vốn đầu tư và bảo hiểm

Data warehouse đa phần được dùng nhằm phân tách Xu thế của quý khách và thị ngôi trường cũng giống như các khuôn mẫu tài liệu không giống trong nghành nghề góp vốn đầu tư và bảo đảm. Thị ngôi trường nước ngoài hối hận và thị ngôi trường kinh doanh thị trường chứng khoán là nhị phân ngành chủ yếu nhập bại liệt kho tài liệu đóng góp một tầm quan trọng cần thiết chính vì một điểm khác lạ rất có thể dẫn theo tổn thất rộng lớn bên trên diện rộng lớn. Data warehouse thông thường được share trong những nghành này và triệu tập nhập truyền tài liệu thời hạn thực.

Xem thêm: sinh tháng 9 là cung gì

  • Hệ thống cung cấp lẻ

Data warehouse đa phần được dùng nhằm phân phối và tiếp thị trong nghành nghề nhỏ lẻ nhằm theo dõi dõi những sản phẩm, đánh giá quyết sách giá thành, theo dõi dõi những thanh toán giao dịch khuyến mại và phân tách Xu thế mua sắm của quý khách. Các chuỗi nhỏ lẻ thông thường phối kết hợp khối hệ thống EDW mang đến yêu cầu dự đoán và BI.

  • Chăm sóc mức độ khỏe

Data warehouse được dùng để tham gia báo sản phẩm, tạo ra report chữa trị và share tài liệu với những ngôi nhà hỗ trợ bảo đảm, chống phân tích và những đơn vị chức năng nó tế không giống trong nghành nghề đỡ đần sức mạnh. EDW là trụ cột của khối hệ thống đỡ đần sức mạnh vì thế vấn đề chữa trị update, tiên tiến nhất là rất rất cần thiết nhập cứu vớt chữa trị.

Với những mối cung cấp tài liệu càng ngày càng rộng lớn, những công ty nhập sau này cần được thể hiện những phân tách và nắm vững tài liệu chất lượng tốt rộng lớn. Các tổ chức triển khai rất có thể cảm nhận được nhiều hơn thế nữa kể từ nỗ lực phân tách của mình bằng phương pháp vượt lên trên ra phía bên ngoài hạ tầng tài liệu đơn giản và giản dị và lao vào toàn cầu kho tài liệu. Việc lần đi ra biện pháp Data warehouse phù phù hợp với yêu cầu sale rất có thể tạo sự khác lạ trong những công việc một doanh nghiệp đáp ứng quý khách và trở nên tân tiến sinh hoạt của tôi một cơ hội hiệu suất cao thế nào.