Hành trình 10 năm với MySQL đưa HeatWave của Oracle vào cuộc thảo luận về cơ sở dữ liệu truy vấn - SiliconANGLE

Khi tập đoàn Oracle. mua lại Sun Microsystems Inc. và MySQL,Năm 2010, doanh nghiệp phải lựa chọn giữa việc theo đuổi một số quan hệ đối tác để trang bị lại công nghệ cơ sở dữ liệu để sử dụng trên toàn bộ hệ thống và kết hợp đổi mới phần cứng và phần mềm vào giải pháp kỹ thuật nội bộ của riêng mình

Con đường thứ hai đã được Oracle chọn và nó đòi hỏi công ty phải làm việc trong mười năm để phát triển. Tuy nhiên, việc ra mắt MySQL HeatWave vào tháng 12 và việc phát hành các tính năng và cải tiến mới sau đó vào tháng 8 đã đặt Oracle vào cuộc thảo luận về xử lý cơ sở dữ liệu truy vấn giống như các đối thủ nặng ký khác trong ngành như Amazon Web Services Inc. Google LLC, Snowflake Inc. , và

Bằng cách hợp nhất các khả năng này vào một nền tảng duy nhất, khách hàng có thể hưởng lợi với chi phí thấp hơn tiềm năng trong khi chạy phân tích trên dữ liệu có khả năng mạnh mẽ hơn và gần đây hơn nhờ chiến lược của Oracle dành cho MySQL, liên quan đến việc tạo cơ sở dữ liệu với Xử lý phân tích trực tuyến được nhúng hoặc OLAP,

Theo Nipun Agarwal, phó chủ tịch MySQL, HeatWave và phát triển nâng cao tại Oracle, khách hàng có được một cơ sở dữ liệu duy nhất với MySQL HeatWave. "Không cần phải di chuyển dữ liệu từ cơ sở dữ liệu này sang cơ sở dữ liệu khác và tất cả các công cụ và ứng dụng hiện có, tương thích với MySQL, sẽ tiếp tục hoạt động như bình thường," Agarwal cho biết trong một cuộc phỏng vấn độc quyền gần đây với sự phát trực tiếp của theCUBE, SiliconANGLE Media. Trình tăng tốc truy vấn trong bộ nhớ MySQL nhanh hơn đáng kể so với bất kỳ phiên bản cơ sở dữ liệu nào, cũng như nhanh hơn đáng kể so với cơ sở dữ liệu phân tích chuyên dụng

Trả lời phản hồi của khách hàng

Oracle đã đưa ra một số lựa chọn thiết kế triết lý để tăng cường tự động hóa đồng thời sử dụng công nghệ phân cụm để mở rộng quy mô cho cả hiệu suất và năng lực. Bộ cải tiến HeatWave gần đây nhất của công ty đã bóc tách những gì Oracle hình dung về tương lai của việc xử lý MySQL trong doanh nghiệp

Theo Agarwal, nhu cầu về các công cụ mới để tự động hóa và mở rộng quy mô cụm bắt nguồn từ sự quan tâm của người dùng MySQL của Oracle đối với việc truy vấn ngoài phân tích và phản ứng của họ đối với bản phát hành đầu tiên của HeatWave vào cuối năm ngoái

Theo Agarwal, HeatWave được dự định là công cụ tăng tốc cho các truy vấn phân tích, nhưng nhiều khách hàng bắt đầu thấy lợi ích của HeatWave không chỉ là phân tích mà còn hơn thế nữa đối với khối lượng công việc hỗn hợp. Chúng tôi đã mở rộng quy mô cụm lớn hơn trong vài tháng qua theo yêu cầu của họ

Từ khóa trong thông báo gần đây nhất của Oracle là "tự động. " Có không ít hơn 40 tham chiếu đến từ trong thông cáo báo chí mô tả các cải tiến HeatWave gần đây nhất, từ "cung cấp tự động" và "tải song song tự động" đến "lập lịch tự động" và "khôi phục lỗi tự động. "”

Người dùng có thể dựa vào HeatWave để loại bỏ rất nhiều nỗ lực thủ công để tối ưu hóa dữ liệu mà không cần dùng đến sharding tốn nhiều công sức, đây là một tiến bộ đáng kể cho các nhà phát triển cơ sở dữ liệu MySQL

Theo Carl Olofson, phó chủ tịch nghiên cứu phần mềm quản lý dữ liệu tại IDC, Oracle muốn mở ra mặt trận thứ hai trong cuộc đấu tranh giành quyền thống trị thị trường cơ sở dữ liệu. "Không có gì bí mật khi các nhà phát triển là lực lượng chính trong tăng trưởng cơ sở dữ liệu ngày nay," ông nói. Với điều này, họ đã thu hút được một cơ sở người dùng hoàn toàn khác

Tìm một cách thông minh hơn

Agarwal mô tả những thay đổi của Oracle đối với HeatWave là một cách thông minh hơn để thu thập các loại dữ liệu mới, thứ mà ông hình dung là mang lại lợi thế cạnh tranh. Việc sử dụng các khả năng tự động hóa dựa trên máy học này đã tạo thêm một nếp nhăn mới cho bối cảnh cơ sở dữ liệu

Agarwal cho biết chúng tôi phải thu thập các loại dữ liệu mới và hiện tại chúng tôi cũng thu thập số liệu thống kê dựa trên các truy vấn. "Chúng tôi đang tăng cường công cụ HeatWave và đó là nơi chứa tất cả logic và tất cả quá trình xử lý. Chúng tôi đã đạt được nhiều tiến bộ trong phương pháp thu thập dữ liệu thông minh của mình và đó là điều mang lại cho chúng tôi lợi thế so với những gì các nhà cung cấp khác có thể cố gắng thực hiện. ”

Mở rộng kích thước cụm trong khi vẫn duy trì hiệu quả xử lý truy vấn cao là một thách thức kỹ thuật khác mà Oracle quyết định giải quyết và Agarwal đã mô tả sự cần thiết phải sửa đổi các thuật toán và kỹ thuật cần thiết để đạt được hiệu quả cao trong khi cung cấp năng lượng cho cụm lớn hơn

Chúng tôi hiện đạt hiệu suất gần 90% cho các truy vấn từ đầu đến cuối, cả về tiêu chuẩn ngành và khối lượng công việc của khách hàng trong thế giới thực. "Đây là một vấn đề kỹ thuật khó khăn và đó là lý do tại sao người ta chú trọng nhiều đến vấn đề này để đảm bảo rằng chúng tôi cung cấp cho khách hàng của mình hiệu quả xử lý rất cao khi họ tăng kích thước dữ liệu," Agarwal nói. Chúng tôi nghĩ rằng hiệu quả 90% là tuyệt vời và cao hơn so với những gì nhiều nhà cung cấp cung cấp

kết quả điểm chuẩn

Khi nói đến HeatWave, những gì các nhà cung cấp khác cung cấp đại diện cho nửa còn lại của phương trình đối với Oracle. Sản phẩm MySQL về giá của công ty có lợi thế hiệu suất rõ ràng so với các đối thủ lớn và công ty đã nỗ lực hết sức để chứng minh điều đó

Công ty đã cung cấp kết quả toàn diện trong bản phát hành tháng 8 và Agarwal đã nhấn mạnh những kết quả đó trong cuộc phỏng vấn sau đó với theCUBE. Oracle đã sử dụng TPC-H, một điểm chuẩn hỗ trợ ra quyết định theo tiêu chuẩn ngành và thuê một công ty độc lập bên thứ ba để tạo ra các so sánh

Các điểm chuẩn chính được sử dụng AWS Redshift, AWS Aurora và Snowflake và Oracle đã đăng các tập lệnh điểm chuẩn trên GitHub có thể truy cập công khai với lời mời mở cho các công ty đối thủ hoặc những người khác cũng chạy so sánh

Theo điểm chuẩn TPC-H 10 terabyte, HeatWave nhanh hơn bảy lần và chỉ bằng một phần năm giá của Snowflake, theo Agarwal. "Snowflake chỉ thực hiện phân tích trong khi MySQL HeatWave thực hiện cả phân tích và xử lý giao dịch. So với Snowflake, nó mang lại tỷ lệ giá/hiệu suất tốt hơn 35 lần

Lời chúc từ AWS chỉ ra rằng công ty không có phản hồi nào đối với các khiếu nại gần đây nhất của Oracle và tại thời điểm xuất bản, một đại diện truyền thông từ Snowflake đã không trả lời yêu cầu bình luận

Tại sao không có ai khác làm điều này?

Nó có lợi thế với tư cách là người giám sát MySQL, với quyền truy cập vào nhiều khách hàng sử dụng giải pháp cơ sở dữ liệu và nó đã dành rất nhiều thời gian để hiểu rõ hơn về các điểm khó khăn trong thế giới công nghệ khó điều khiển, nơi dường như có thể mất sáu tháng để cập nhật một công cụ điện toán quan trọng.

Thậm chí còn mất nhiều thời gian hơn để biến sự hiểu biết đó thành một giải pháp sáng tạo, điều mà Agarwal tự do thừa nhận

Nó cần có thời gian; . Cần có thời gian, sự kiên nhẫn và tài năng; . ”

Khi tập đoàn Oracle. đến MySQL thông qua việc mua Sun Microsystems Inc. Năm 2010, công ty đã có quyết định thực hiện. Công ty có nên theo đuổi một loạt quan hệ đối tác để trang bị lại công nghệ cơ sở dữ liệu cho mục đích sử dụng rộng rãi hơn của doanh nghiệp hay nên tích hợp đổi mới phần cứng và phần mềm vào giải pháp kỹ thuật nội bộ của riêng mình?

Oracle đã chọn con đường thứ hai và công ty đã mất 10 năm phát triển. Tuy nhiên, việc giới thiệu MySQL HeatWave vào tháng 12, tiếp theo là việc phát hành các tính năng và cải tiến bổ sung vào tháng 8 này, đã định vị Oracle một cách thẳng thắn trong cùng một cuộc thảo luận về xử lý cơ sở dữ liệu truy vấn, cùng với các đối thủ nặng ký khác như Amazon Web Services Inc. , Snowflake Inc. và Google LLC

Chiến lược của Oracle dành cho MySQL liên quan đến việc tạo cơ sở dữ liệu với khả năng Xử lý phân tích trực tuyến được nhúng hoặc OLAP, giúp loại bỏ nhu cầu trích xuất, chuyển đổi và tải dữ liệu từ hệ thống giao dịch sang kho lưu trữ phân tích riêng biệt. Bằng cách hội tụ những khả năng này vào một nền tảng duy nhất, khách hàng có thể thu được lợi ích với chi phí thấp hơn tiềm năng trong khi chạy phân tích trên dữ liệu mới hơn và có tiềm năng mạnh mẽ hơn

“Với MySQL HeatWave, khách hàng có được một cơ sở dữ liệu duy nhất có thể được sử dụng cho cả xử lý giao dịch và phân tích,” Nipun Agarwal, phó chủ tịch MySQL, HeatWave và phát triển nâng cao tại Oracle, cho biết trong một cuộc phỏng vấn độc quyền gần đây với CUBE, buổi phát trực tiếp của SiliconANGLE Media . “Không cần di chuyển dữ liệu từ cơ sở dữ liệu này sang cơ sở dữ liệu khác và tất cả các công cụ và ứng dụng hiện có, tương thích với MySQL, sẽ tiếp tục hoạt động như bình thường. Trình tăng tốc truy vấn trong bộ nhớ dành cho MySQL nhanh hơn đáng kể so với bất kỳ phiên bản cơ sở dữ liệu MySQL nào và cũng nhanh hơn nhiều so với cơ sở dữ liệu chuyên biệt dành cho phân tích. ”

Trả lời phản hồi của khách hàng

Tập hợp các cải tiến gần đây nhất đối với HeatWave đã bóc tách những gì Oracle hình dung về tương lai của việc xử lý MySQL trong doanh nghiệp. Công ty đã đưa ra một số quyết định thiết kế triết lý để tăng cường tự động hóa trong khi sử dụng công nghệ phân cụm để mở rộng quy mô cho cả hiệu suất và công suất

Theo Agarwal, những thay đổi này được thúc đẩy bởi phản ứng của khách hàng đối với bản phát hành đầu tiên của HeatWave vào cuối năm ngoái. Người dùng MySQL của Oracle bày tỏ sự quan tâm đến việc chạy các truy vấn ngoài phân tích, điều này sẽ yêu cầu các công cụ mới để tự động hóa và mở rộng quy mô cụm

“Họ muốn có nhiều lớp truy vấn hơn được truy cập bằng HeatWave,” Agarwal nói. “HeatWave được thiết kế để trở thành công cụ tăng tốc cho các truy vấn phân tích, nhưng nhiều khách hàng bắt đầu thấy lợi ích của HeatWave không chỉ là phân tích mà còn hơn thế nữa đối với khối lượng công việc hỗn hợp. Họ muốn chúng tôi mở rộng quy mô thành một cụm lớn hơn và đó là những gì chúng tôi đã làm trong vài tháng qua. ”

Từ hoạt động trong thông báo mới nhất của Oracle là “tự động. ” Thông cáo báo chí của Oracle, trình bày chi tiết các cải tiến HeatWave mới nhất, chứa không ít hơn 40 tham chiếu đến từ này, chạy phạm vi từ “cung cấp tự động” và “tải song song tự động” đến “lập lịch tự động” và “khôi phục lỗi tự động. ”

Điều này thể hiện một tiến bộ đáng kể cho các nhà phát triển cơ sở dữ liệu MySQL. Thay vì phải tham gia vào sharding tốn nhiều công sức để mở rộng quy mô MySQL, người dùng có thể dựa vào HeatWave để loại bỏ phần lớn nỗ lực thủ công để tối ưu hóa dữ liệu

“Không có gì bí mật khi các nhà phát triển là lực lượng chính trong việc phát triển cơ sở dữ liệu ngày nay,” Carl Olofson, phó chủ tịch nghiên cứu về phần mềm quản lý dữ liệu tại IDC, cho biết trong một cuộc phỏng vấn với theCUBE. “Oracle muốn mở ra mặt trận thứ hai trong cuộc chiến giành vị trí dẫn đầu thị trường cơ sở dữ liệu. Họ đang thu hút một cơ sở người dùng hoàn toàn khác với điều này. ”

Tìm một cách thông minh hơn

Việc sử dụng các khả năng tự động hóa dựa trên máy học này đã tạo thêm một nếp nhăn mới cho bối cảnh cơ sở dữ liệu. Agarwal mô tả những thay đổi của Oracle đối với HeatWave là một cách thông minh hơn để thu thập các loại dữ liệu mới mà ông hình dung là mang lại lợi thế cạnh tranh

“Chúng tôi đang cải tiến công cụ HeatWave và đó là nơi chứa tất cả logic và tất cả quá trình xử lý,” Agarwal giải thích. “Chúng tôi đã phải thu thập các loại dữ liệu mới và bây giờ chúng tôi cũng thu thập số liệu thống kê dựa trên các truy vấn. Chúng tôi đã thực hiện rất nhiều đổi mới trong quá trình thu thập dữ liệu một cách thông minh. Đó là những gì mang lại cho chúng tôi lợi thế so với những gì các nhà cung cấp khác có thể cố gắng làm. ”

Thách thức kỹ thuật khác mà Oracle quyết định giải quyết liên quan đến việc mở rộng quy mô cụm trong khi vẫn duy trì hiệu quả xử lý truy vấn cao. Theo Agarwal, đây không phải là một nhiệm vụ đơn giản, người đã mô tả nhu cầu điều chỉnh các thuật toán và kỹ thuật cần thiết để đạt được hiệu quả cao trong khi cung cấp năng lượng cho một cụm lớn hơn

“Đây là một vấn đề kỹ thuật khó, và đó là lý do tại sao người ta chú trọng nhiều đến vấn đề này để đảm bảo chúng tôi cung cấp cho khách hàng của mình hiệu quả xử lý rất cao khi họ tăng kích thước dữ liệu,” Agarwal cho biết. “Chúng tôi hiện đạt hiệu suất gần 90% cho các truy vấn từ đầu đến cuối, cả về tiêu chuẩn ngành cũng như khối lượng công việc của khách hàng trong thế giới thực. Chúng tôi tin rằng hiệu quả 90% này là rất tốt và cao hơn so với những gì nhiều nhà cung cấp cung cấp. ”

kết quả điểm chuẩn

Những gì các nhà cung cấp khác cung cấp đại diện cho nửa còn lại của phương trình cho Oracle khi nói đến HeatWave. Công ty tin rằng sản phẩm MySQL của họ có lợi thế về giá/hiệu suất khác biệt so với các đối thủ cạnh tranh lớn và họ đã mất nhiều thời gian để chứng minh điều đó.

Oracle đã sử dụng TPC-H, một điểm chuẩn hỗ trợ ra quyết định theo tiêu chuẩn ngành và thuê một công ty độc lập bên thứ ba để tạo ra các so sánh. Công ty đã cung cấp kết quả chi tiết trong thông cáo báo chí vào tháng 8 và Agarwal đã nhắc lại những kết quả đó trong cuộc phỏng vấn sau đó với theCUBE

Oracle đã đăng các tập lệnh điểm chuẩn trên GitHub có sẵn công khai với lời mời mở cho các công ty cạnh tranh hoặc những người khác cũng chạy so sánh. Các điểm chuẩn chính liên quan đến AWS Redshift, AWS Aurora và Snowflake

“Snowflake chỉ thực hiện phân tích trong khi MySQL HeatWave thực hiện cả phân tích và xử lý giao dịch,” Agarwal lưu ý. “Trên điểm chuẩn TPC-H 10 terabyte, HeatWave nhanh hơn bảy lần và chi phí chỉ bằng một phần năm. Đó là giá / hiệu suất tốt hơn 35 lần so với Snowflake. ”

Tính đến thời điểm báo chí, một đại diện truyền thông từ Snowflake đã không trả lời yêu cầu bình luận. Người phát ngôn của AWS chỉ ra rằng công ty sẽ không có phản hồi nào đối với các khiếu nại gần đây nhất của Oracle

Những tiến bộ của Oracle trong không gian MySQL với HeatWave đặt ra một câu hỏi quan trọng. Tại sao không có ai khác làm điều này?

Trong một thế giới công nghệ khó điều khiển, nơi sáu tháng để cập nhật một công cụ điện toán quan trọng dường như là vô tận, Oracle đã quyết định chơi cuộc chơi dài hơi. Nó có lợi thế là người quản lý MySQL, với quyền truy cập vào nhiều khách hàng hiện đang sử dụng giải pháp cơ sở dữ liệu và nó đã dành rất nhiều thời gian để hiểu rõ hơn về các điểm yếu

Thậm chí còn mất nhiều thời gian hơn để biến kiến ​​thức đó thành một giải pháp sáng tạo, điều mà Agarwal tự do thừa nhận

"Nó cần có thời gian; . “Là một phần trong đó, chúng tôi phải phát minh ra các thuật toán mới để xử lý truy vấn phân tán cho đám mây. Điều này đã đưa chúng ta gần một thập kỷ; . Phải mất thời gian, sự kiên nhẫn và tài năng. ”

Dịch vụ cơ sở dữ liệu MySQL với HeatWave là gì?

MySQL HeatWave là một dịch vụ cơ sở dữ liệu được quản lý đầy đủ cho phép khách hàng chạy khối lượng công việc OLTP, OLAP và máy học trực tiếp từ Cơ sở dữ liệu MySQL của họ .

Oracle tiếp quản MySQL khi nào?

MySQL trở thành một phần của Oracle sau khi Oracle mua lại Sun vào 2010 . Nhóm MySQL tại Oracle thúc đẩy tất cả các khía cạnh của MySQL, bao gồm kỹ thuật, tiếp thị, bán hàng và hỗ trợ.

MySQL HeatWave có tốt không?

TCO/Phân tích hiệu suất . Và một lần nữa, đó là không có độ trễ quy trình ETL đang diễn ra và chi phí gia tăng. MySQL HeatWave has demonstrated a performance advantage of 58% over AWS, 154% over Snowflake, 293% over GCP, and 347% over Azure. And again, that is without the ongoing ETL process latencies and added cost.

MySQL có được tạo bởi Oracle không?

Bởi vì MySQL thuộc sở hữu của Oracle nên có nhiều hạn chế khi so sánh với các hệ thống quản lý cơ sở dữ liệu quan hệ mã nguồn mở khác. Mặc dù nó linh hoạt cho các doanh nghiệp lớn và nhỏ, nhưng nó không được xây dựng cho dữ liệu quy mô lớn như Oracle SQL. MySQL cũng không hỗ trợ tích hợp với các ứng dụng khách khác.