Người thường xuyên sử dụng cơ sở dữ liệu là ai

Với một cơ sở dữ liệu lớn, rất nhiều người tham gia vào việc thiết kế, sử dụng và duy trì cơ sở dữ liệu. Những người liên quan đến hệ cơ sở dữ liệu được chia thành hai nhóm chính. Nhóm thứ nhất gồm những người mà công việc của họ liên quan hàng ngày đến cơ sở dữ liệu, đó là những người quản trị cơ sở dữ liệu, thiết kế cơ sở dữ liệu, sử dụng cơ sở dữ liệu, phân tích hệ thống và lập trình ứng dụng. Nhóm thứ hai gồm những người làm việc để duy trì môi trường hệ cơ sở dữ liệu nhưng không quan tâm đến bản thân cơ sở dữ liệu, đó là những người thiết kế và cài đặt hệ quản trị cơ sở dữ liệu, phát triển công cụ, thao tác viên và bảo trì.

Người quản trị hệ cơ sở dữ liệu (Database Administrator – DBA)

Trong một tổ chức có nhiều người cùng sử dụng các tài nguyên, cần phải có một người giám sát và quản lý. Trong môi trường hệ cơ sở dữ liệu, các tài nguyên là cơ sở dữ liệu, hệ quản trị cơ sở dữ liệu và các phần mềm liên quan. Người quản trị hệ cơ sở dữ liệu là người chịu trách nhiệm quản lý các tài nguyên đó. Người này chịu trách nhiệm về việc cho phép truy cập cơ sở dữ liệu, tổ chức và hướng dẫn việc sử dụng cơ sở dữ liệu, cấp các phần mềm và phần cứng theo yêu cầu.

Người này chịu trách nhiệm xác định các dữ liệu sẽ được lưu giữ trong cơ sở, chọn các cấu trúc thích hợp để biểu diễn và lưu giữ các dữ liệu đó. Những nhiệm vụ này được thực hiện trước khi cơ sở dữ liệu được cài đặt và phổ biến. Người thiết kế có trách nhiệm giao thiệp với những người sử dụng tương lai để hiểu được các đòi hỏi của họ và đưa ra một thiết kế thoả mãn các yêu cầu đó. Anh ta cũng có nhiệm vụ giao thiệp với các nhóm người sử dụng và có khả năng hỗ trợ các yêu cầu của các nhóm.

Những người sử dụng là những người mà công việc của họ đòi hỏi truy cập đến cơ sở dữ liệu để truy vấn, cập nhật và sinh ra các thông tin. Có thể chia những người sử dụng thành hai nhóm chính: những người sử dụng thụ động (tức là những người sử dụng không có nhiều kiến thức về hệ cơ sở dữ liệu) và những người sử dụng chủ động (là những người có hiểu biết tốt về hệ cơ sở dữ liệu).

Chức năng công việc của những người sử dụng thụ động (chiếm phần lớn những người sử dụng) gắn liền với việc truy vấn và cập nhật thường xuyên cơ sở dữ liệu bằng cách sử dụng các câu hỏi và các cập nhật chuẩn (gọi là các giao tác định sẵn) đã được lập trình và kiểm tra cẩn thận. Những người này chỉ cần học một ít về các phương tiện do hệ quản trị cơ sở dữ liệu cung cấp và hiểu các kiểu giao tác chuẩn đã được thiết kế và cài đặt là đủ.

Những người sử dụng chủ động có hiểu biết tốt về hệ cơ sở dữ liệu, họ có thể tự cài đặt các ứng dụng riêng của mình để làm thoả mãn các yêu cầu phức tạp của họ.

Người phân tích hệ thống và lập trình ứng dụng

Người phân tích hệ thống xác định các yêu cầu của những người sử dụng (chủ yếu là những người sử dụng thụ động) để đặc tả các chương trình phù hợp với yêu cầu của họ.

Người viết chương trình ứng dụng thể hiện các đặc tả của những người phân tích thành chương trình, sau đó kiểm thử, sửa lỗi làm tài liệu và bảo trì các giao tác định sẵn.

Người thiết kế và cài đặt hệ quản trị dữ liệu

Đó là những người thiết kế, cài đặt các mô đun, giao diện của hệ quản trị cơ sở dữ liệu thành các phần mềm đóng gói. Một hệ quản trị cơ sở dữ liệu là một hệ thống phần mềm phức tạp bao gồm nhiều thành phần (mô đun). Đó là các mô đun cài đặt từ điển dữ liệu, ngôn ngữ truy vấn, bộ xử lý giao diện, truy cập dữ liệu, kiểm tra cạnh tranh, phục hồi và an toàn. Hệ quản trị cơ sở dữ liệu phải giao tiếp với các hệ thống phần mềm khác như hệ điều hành và các chương trình dịch cho nhiều ngôn ngữ khác nhau.

Những người phát triển công cụ

Là những người thiết kế và cài đặt các công cụ (tool), đó là các phần mềm đóng gói làm dễ việc thiết kế và sử dụng cơ sở dữ liệu.

Các thao tác viên và những người bảo trì

Là những người chịu trách nhiệm về việc chạy và bảo trì phần cứng và phần mềm của hệ thống.

Ngôn ngữ cơ sở dữ liệu và giao diện

Các ngôn ngữ hệ quản trị cơ sở dữ liệu

Một khi việc thiết kế cơ sở dữ liệu đã hoàn thành, cần phải chọn một hệ quản trị cơ sở dữ liệu để cài đặt cơ sở dữ liệu. Trong các hệ quản trị cơ sở dữ liệu hiện nay thường có các ngôn ngữ: ngôn ngữ định nghĩa dữ liệu (data definition language – DDL) và ngôn ngữ thao tác dữ liệu (data manipulation language – DML).

Ngôn ngữ định nghĩa dữ liệu được sử dụng để định nghĩa các lược đồ. Hệ quản trị cơ sở dữ liệu có một chương trình dịch ngôn ngữ DDL, nhiệm vụ của nó là xử lý các câu lệnh DDL để xác định mô tả của cấu trúc lược đồ và lưu trữ mô tả lược đồ vào từ điển của hệ quản trị cơ sở dữ liệu.

Ngôn ngữ thao tác cơ sở dữ liệu được sử dụng để thao tác cơ sở dữ liệu. Các thao tác chính gồm có lấy ra, chèn vào, loại bỏ và sửa đổi các dữ liệu. Có hai kiểu ngôn ngữ thao tác dữ liệu chính: ngôn ngữ thao tác dữ liệu mức cao hoặc ngôn ngữ phi thủ tục hoặc ngôn ngữ thao tác dữ liệu mức thấp.

Ngôn ngữ thao tác dữ liệu mức cao có thể được sử dụng để diễn đạt các phép toán cơ sở dữ liệu một cách ngắn gọn. Phần lớn các hệ quản trị cơ sở dữ liệu cho phép nhập các lệnh của ngôn ngữ thao tác dữ liệu mức cao theo cách lặp (nghĩa là sau khi nhập một lệnh, hệ thống sẽ thực hiện lệnh đó rồi mới nhập lệnh tiếp theo) hoặc được nhúng vào một ngôn ngữ lập trình vạn năng. Trong trường hợp nhúng vào ngôn ngữ khác, các lệnh của ngôn ngữ thao tác dữ liệu phải được xác định bên trong chương trình sao cho một chương trình tiền dịch có thể nhận ra chúng và được hệ quản trị cơ sở dữ liệu xử lý.

Ngôn ngữ thao tác cơ sở dữ liệu mức thấp hoặc ngôn ngữ thủ tục phải được nhúng vào trong một ngôn ngữ lập trình vạn năng. Ngôn ngữ thao tác cơ sở dữ liệu kiểu này thường rút ra các bản ghi hoặc các đối tượng riêng rẽ và xử lý chúng một cách riêng rẽ. Vì vậy, chúng cần phải sử dụng các cấu trúc ngôn ngữ lập trình như vòng lặp, điều kiện,… để rút ra từng bản ghi một từ một tập các bản ghi. Ngôn ngữ thao tác dữ liệu mức thấp được gọi là ngôn ngữ “một lần một bản ghi”. Các ngôn ngữ thao tác dữ liệu mức cao có thể dùng một lệnh để rút ra một lúc nhiều bản ghi nên chúng được gọi là ngôn ngữ “một lần một tập hợp”.

Các loại giao diện hệ quản trị cơ sở dữ liệu

Các hệ quản trị cơ sở dữ liệu cung cấp rất nhiều loại giao diện người dùng thân thiện. Các loại giao diện chính gồm có:

Giao diện dựa trên bảng chọn:Các giao diện này cung cấp cho người sử dụng danh sách các lựa chọn, gọi là bảng chọn (menu) và hướng dẫn người sử dụng diễn đạt một yêu cầu từ đầu đến cuối. Các bảng chọn làm cho người sử dụng không cần nhớ các lệnh và cú pháp của ngôn ngữ truy vấn. Các bảng chọn thả xuống đã trở thành kỹ thuật phổ biến trong các giao diện dựa trên cửa sổ. Chúng thường được sử dụng trong các giao diện quét, cho phép người sử dụng nhìn thấy nội dung của một cơ sở dữ liệu theo cách không có cấu trúc.

Giao diện dựa trên mẫu biểu: Các giao diện này hiển thị một mẫu biểu cho người sử dụng. Những người sử dụng có thể điền vào tất cả các ô của mẫu biểu để nhập các dữ liệu mới hoặc họ chỉ điền vào một số ô còn hệ quản trị cơ sở dữ liệu sẽ đưa ra các dữ liệu phù hợp cho các ô khác. Các mẫu biểu thường được thiết kế và được lập trình cho các người dùng đơn giản. Một số hệ thống có các tiện ích giúp người sử dụng từng bước xây dựng một mẫu biểu trên màn hình.

Giao diện đồ hoạ: Một giao diện đồ hoạ (GUI) thường hiển thị một lược đồ cho người sử dụng dưới dạng biểu đồ. Người dùng có thể thực hiện một truy vấn bằng cách thao tác trên biểu đồ. Trong nhiều trường hợp, GUI sử dụng cả các bảng chọn và các mẫu biểu. Đa số các GUI sử dụng các công cụ trỏ như chuột, phím để kích các phần của sơ đồ.

Giao diện cho người quản trị hệ thống: Đa số các hệ quản trị cơ sở dữ liệu có các lệnh ưu tiên, chỉ có những người quản trị hệ thống mới sử dụng các lệnh đó. Đó là các lệnh tạo ra các tài khoản (account), đặt các tham số cho hệ thống, cấp các tài khoản, thay đổi lược đồ hoặc tổ chức lại các cấu trúc lưu trữ của cơ sở dữ liệu.


Thời đại 4.0, cơ sở dữ liệu là một khái niệm được sử dụng trong hầu hết các ngành nghề với vai trò vô cùng quan trọng. Vậy cơ sở dữ liệu hiểu chính xác là gì và phân loại, tác động, lợi ích sử dụng ra sao? BKAII sẽ cùng các bạn tìm hiểu nhé!

Người thường xuyên sử dụng cơ sở dữ liệu là ai

Theo Wikipedia, Cơ sở dữ liệu (Database) là một tập hợp các dữ liệu có tổ chức, thường được lưu trữ và truy cập điện tử từ hệ thống máy tính. Khi cơ sở dữ liệu phức tạp hơn, chúng thường được phát triển bằng cách sử dụng các kỹ thuật thiết kế và mô hình hóa chính thức.

Khi áp dụng hình thức lưu trữ này, nó sẽ giúp khắc phục được những điểm yếu của việc lưu file thông thường trên máy tính. Các thông tin lưu trữ sẽ đảm bảo được nhất quán, hạn chế tình trạng trùng lặp thông tin.

Phân loại

Trên thực tế có rất nhiều cách thức để phân loại cơ sở dữ liệu, BKAII sẽ liệt kê một số cách phân loại hay gặp nhé

Phân loại theo loại dữ liệu:

-  Cơ sở dữ liệu có cấu trúc (structured database): có nghĩa là cơ sở dữ liệu dữ liệu được định hình theo một cấu trúc xác định từ trước. Chúng ta có thể hình dung như một thư viện với các tủ hồ sơ được đánh nhãn, trong mỗi tủ được phân ngăn rõ ràng. Cơ sở dữ liệu có cấu trúc được xây dựng sẽ dễ dàng quản lý và truy cập thông tin.

-  Cơ sở dữ liệu phi cấu trúc (unstructured database): là cơ sở dữ liệu không được xác định cấu trúc thông tin từ trước. Thường là tập hợp các dữ liệu thô, hỗn tạp và không đồng nhất. Các thành phần của cơ sở dữ liệu không có đặc điểm chung. Để quản lý, dữ liệu phi cấu trúc cần được chuyển đổi thành dữ liệu có cấu trúc qua quá trình chuẩn hóa.

-  Cơ sở dữ liệu bán cấu trúc (semi-structured database): thường là dữ liệu có cấu trúc nhưng không đồng nhất. Cấu trúc của dữ liệu phụ thuộc vào chính nội dung của dữ liệu ấy. Đây là cơ sở dữ liệu có nhiều ưu điểm do lưu trữ được hầu hết các loại dữ liệu khác nhau nên cơ sở dữ liệu bán cấu trúc là hướng mới trong nghiên cứu và ứng dụng và được sử dụng thông dụng trên mạng Internet.

Phân loại theo hình thức lưu trữ, mô hình tổ chức

-  Cơ sở dữ liệu dạng tệp (file database) dữ liệu được lưu trữ dưới dạng các file có thể là văn bản, ảnh, thông tin nhị phân, hoặc phát triển hơn là tệp cơ sở dữ liệu nhỏ gọn của các phần mềm quản lý dữ liệu.

-  Cơ sở dữ liệu quan hệ (relational database): dữ liệu được lưu trữ trong các bảng dữ liệu gọi là các thực thể, giữa các thực thể này có mối liên hệ với nhau gọi là các quan hệ, mỗi quan hệ có các thuộc tính, trong đó có một thuộc tính là khóa chính. Các hệ quản trị hỗ trợ cơ sở dữ liệu quan hệ như: MS SQL server, Oracle, MySQL… là đặc trưng thể hiện của các cơ sở dữ liệu này.

-  Cơ sở dữ liệu phân cấp (herachical database):  Một mô hình cơ sở dữ liệu phân cấp là một mô hình dữ liệu trong đó các dữ liệu được tổ chức thành một cây cấu trúc. Các dữ liệu được lưu trữ như các hồ sơ đó được kết nối với nhau thông qua các liên kết. Một thực thể là một tập hợp của các thực thể con, mỗi thực thể con cuối cùng (gọi là lá) chỉ chưa giá trị.

Phân loại theo đặc tính sử dụng

-  Cơ sở dữ liệu hoạt động (operational databases): Trong hoạt động của mỗi cơ quan, đơn vị hay doanh nghiệp luôn sản sinh ra một lượng lớn thông tin. Các thông tin này lại là đầu vào cho quá trình thực hiện một nghiệp vụ khác. Các thông tin này được đưa vào các cơ sở dữ liệu để quản lý và truy xuất bởi các đối tượng khác nhau. Đây chính là hình thức của các cơ sở dữ liệu hoạt động.

-  Cơ sở dữ liệu kho (data warehouse): Các tổ chức được yêu cầu phải giữ tất cả các dữ liệu có liên quan trong nhiều năm. Những thông tin này cũng là một nguồn quan trọng của thông tin để phân tích và so sánh các dữ liệu năm nay với các năm trước đó cũng làm cho nó dễ dàng hơn để xác định xu hướng chính phát triển của các tổ chức đang diễn ra. Tất cả các dữ liệu này từ năm trước đó được lưu trữ trong một kho dữ liệu. Kể từ khi dữ liệu được lưu trữ đã trải qua tất cả các loại sàng lọc, chỉnh sửa và tích hợp.

-  Cơ sở dữ liệu ngữ nghĩa (semantic database): Đây là cơ sở dữ liệu mới thường được nhắc đến trong thời đại Internet. Là một cơ sở dữ liệu mềm dẻo và linh hoạt lưu trữ ngữ nghĩa của thông tin như như các sự kiện của các đối tượng. Cơ sở dữ liệu dữ liệu ngữ nghĩa được thiết kế để đại diện cho thế giới thực một cách chính xác nhất có thể trong tập hợp dữ liệu. Ký hiệu dữ liệu được tổ chức tuyến tính và phân cấp để cung cấp cho những ý nghĩa nhất định như một trong những mô tả ở trên. Bằng đại diện cho thế giới thực trong bộ dữ liệu, dữ liệu ngữ nghĩa cho phép các máy để tương tác với thông tin của thế gian mà không cần giải thích bởi con người.

Phân loại theo mô hình triển khai

-  Cơ sở dữ liệu tập trung (centralized database): Một cơ sở dữ liệu tập trung  là một cơ sở dữ liệu được đặt, lưu trữ, và duy trì trong một địa điểm duy nhất. Đây là vị trí thường xuyên nhất thiết đặt một hệ thống máy tính hoặc cơ sở dữ liệu hệ thống trung tâm, ví dụ một máy tính chủ, hoặc một hệ thống máy tính máy tính lớn (Wikipedia). Thông thường, một cơ sở dữ liệu tập trung sẽ được duy trì và quản lý bởi một đầu mối, một tổ chức hoặc một cơ quan. Người dùng truy cập vào một cơ sở dữ liệu tập trung thông qua hệ thống mạng nội bộ hoặc mạng diện rộng, internet để truy cập vào các cơ sở dữ liệu để cập nhật hoặc khai thác trung tâm CPU, do đó duy trì cơ sở dữ liệu riêng của mình

-  Cơ sở dữ liệu phân tán (distributed database) là cơ sở dữ liệu không được lưu trữ và xử lý bởi nhiều máy tính, nhiều hệ thống thông tin và thường được đặt ở nhiều vị trí khác nhau. Các vị trí được kết nối với nhau bằng hệ thống mạng (có thể không thường xuyên trực tuyến). cơ sở dữ liệu phân tán có thể được quản lý bởi nhiều cơ quan, đơn vị và tổ chức khác nhau nhưng cần có một chính sách thống nhất để các cơ sở dữ liệu tương hợp và trao đổi thông tin với nhau.

-  Cơ sở dữ liệu tập trung có bản sao: Các cơ sở dữ liệu tập trung và phân tán thường có những ưu điểm và nhược điểm của mình. Quyết định sử dụng loại nào còn phụ thuộc vào yếu tố quản lý và kỹ thuật như sự tham gia của các cơ quan, chính sách quản lý và khai thác dữ liệu, sự ổn định và tốc độ kết nối mạng, mức độ đáp ứng người sử dụng… cơ sở dữ liệu tập trung bản sao là cơ sở dữ liệu được lai giữa hai loại tập trung và phân tán trong đó một cơ sở dữ liệu tập trung lưu toàn bộ dữ liệu theo phạm vi quản lý, triển khai thêm các cơ sở dữ liệu thành phần bản sao theo từng phạm vi dữ liệu và kết nối đồng bộ đến cơ sở dữ liệu trung tâm.

Ưu điểm

Trước đây người ta chỉ quản lý dữ liệu bằng các file riêng biệt, cách làm này chỉ phù hợp trong điều kiện quản lý dữ liệu ở quy mô nhỏ, còn đối với những trường quản lý dữ liệu số lượng lớn thì đòi hỏi phải sử dụng đến cơ sở dữ liệu.

  • Việc quản lý dữ liệu bằng cơ sở dữ liệu mang đến lợi ích tích cực, giúp cho việc lưu trữ, truy xuất, sử dụng dữ liệu đạt hiệu suất tốt hơn.
  • Khi cả công ty dùng chung một cơ sở dữ liệu, các phòng ban khác có thể dễ dàng truy cập vào database và lấy thông tin khi họ cần, điều này giúp tránh được việc trùng lập dữ liệu, gây lãng phí tài nguyên.
  • Khi đã dùng chung cơ sở dữ liệu, thông tin được cập nhật trên cơ sở dữ liệu thì khi người dùng lấy dữ liệu, dữ liệu sẽ được đảm bảo đồng bộ hoàn toàn.
  • Việc tìm kiếm thông tin cũng vô vùng dễ dàng khi dữ liệu đã được quản lý bởi DBMS, chúng ta có thể thêm filter, tìm kiếm, gom nhóm các thông tin lại với nhau bằng cách dùng câu truy vấn.
  • Thông tin được quản lý ở một nơi duy nhất, đảm bảo việc bảo mật dữ liệu, tránh rò rỉ thông tin. Ngoài ra có thể phân quyền cho người dùng, ai có thể truy cập dữ liệu, ai không được.

Nhược điểm

Việc sử dụng cơ sở dữ liệu cũng có một số nhược điểm sau:

  • Dùng chung cơ sở dữ liệu khi xảy ra sự cố, toàn bộ dữ liệu sẽ bị mất hoàn toàn. Tuy nhiên nhược điểm này có thể dễ dàng khắc phục bằng cách sao lưu dữ liệu thường xuyên.
  • Việc dùng chung cơ sở dữ liệu khi có quá nhiều truy vấn sẽ gây nghẽn, sập hệ thống. Tuy nhiên, trong thực tế, lượng truy vấn đến cơ sở dữ liệu đã được ước tính và đầu tư vào cấu hình máy chủ cho phù hợp.

Trên đây là một vài tìm hiểu của BKAII về sơ sở dữ liệu database có thắc mắc hay cần thêm thông tin gì các bạn liên hệ BKAII nhé!

Xem thêm:

"BKAII -Thiết bị truyền thông TỐT nhất với giá CẠNH TRANH nhất!"