Trong Oracle, REGEXP_SUBSTR()
hàm trả về một chuỗi con từ một chuỗi, dựa trên một mẫu biểu thức chính quy.
Nó mở rộng chức năng của SUBSTR()
bằng cách cho phép chúng tôi sử dụng các mẫu biểu thức chính quy.
Cú pháp
Cú pháp như sau:
REGEXP_SUBSTR ( source_char, pattern
[, position
[, occurrence
[, match_param
[, subexpr ]
]
]
]
)
Ở đâu:
-
source_char
là một biểu thức ký tự đóng vai trò là giá trị tìm kiếm. -
pattern
là biểu thức chính quy. -
position
là một số nguyên dương chỉ định nơi bắt đầu tìm kiếm. Giá trị mặc định là1
, nghĩa là bắt đầu tìm kiếm ở ký tự đầu tiên. -
occurrence
là một số nguyên không âm xác định sự xuất hiện nào cần tìm kiếm. Giá trị mặc định là1
, có nghĩa là các tìm kiếm cho lần xuất hiện đầu tiên. -
match_param
cho phép bạn thay đổi hành vi đối sánh mặc định của hàm. Ví dụ:nó cho phép bạn chỉ định phân biệt chữ hoa chữ thường, cách xử lý nhiều dòng và khoảng trắng, v.v. Đối số này hoạt động giống như khi được sử dụng vớiREGEXP_COUNT()
hàm số. Xem tài liệu của Oracle về chức năng đó để biết thêm thông tin. - Đối với
pattern
với biểu thức con,subexpr
là một số nguyên không âm từ 0 đến 9 cho biết biểu thức con nào trongpattern
được trả về bởi hàm. Đối số này hoạt động giống như khi được sử dụng vớiREGEXP_INSTR()
hàm số. Xem tài liệu của Oracle để biết thêm thông tin về chức năng đó.
Ví dụ
Đây là ví dụ cơ bản về việc sử dụng REGEXP_SUBSTR()
trong Oracle:
SELECT
REGEXP_SUBSTR('Cats and dogs', 'd.g')
FROM DUAL;
Kết quả:
dog
Trong trường hợp này, có một kết quả phù hợp và chuỗi con phù hợp đầu tiên (và trong trường hợp này là duy nhất) được trả về.
Biểu thức chính quy có thể rất mạnh và ví dụ này sử dụng một ví dụ rất đơn giản. Để sử dụng REGEXP_SUBSTR()
một cách hiệu quả, bạn sẽ cần biết mẫu chính xác để sử dụng cho kết quả mong muốn.
Không phù hợp
Dưới đây là một ví dụ mà không có kết quả phù hợp nào:
SET NULL 'null';
SELECT REGEXP_SUBSTR('My dogs like dregs', 't.g')
FROM DUAL;
Kết quả:
null
Không có kết quả phù hợp, vì vậy null
được trả lại.
Theo mặc định, SQLcl và SQL * Plus trả về một khoảng trống bất cứ khi nào null
xảy ra do một SELECT
trong SQL tuyên bố.
Tuy nhiên, bạn có thể sử dụng SET NULL
để chỉ định một chuỗi khác được trả về. Ở đây tôi đã chỉ định rằng chuỗi null
nên được trả lại.
Nhiều Kết hợp
Dưới đây là một ví dụ với nhiều kết quả phù hợp:
SELECT
REGEXP_SUBSTR('My dogs have dags', 'd.g')
FROM DUAL;
Kết quả:
dog
Tuy nhiên, bạn có thể chỉ định sự xuất hiện nào cần thay thế nếu cần:
SELECT
REGEXP_SUBSTR('My dogs have dags', 'd.g', 1, 2)
FROM DUAL;
Kết quả:
dag
Lưu ý rằng tôi đã thêm hai đối số ở đây; 1
và 2
. 1
chỉ định vị trí trong chuỗi để bắt đầu tìm kiếm (trong trường hợp này là ở ký tự đầu tiên). 2
là những gì chỉ định sự xuất hiện nào để tìm kiếm. Trong trường hợp này, lần xuất hiện thứ hai được tìm kiếm.
Đây là những gì sẽ xảy ra nếu tôi bắt đầu tìm kiếm sau lần xuất hiện đầu tiên:
SELECT
REGEXP_SUBSTR('My dogs have dags', 'd.g', 8, 2)
FROM DUAL;
Kết quả:
null
Trong trường hợp này không có kết quả khớp nào, vì chỉ có một lần xuất hiện nữa sau vị trí xuất phát.
Nếu tôi thay đổi đối số cuối cùng thành 1
, sau đó chúng tôi nhận được một kết quả phù hợp (vì đó là lần xuất hiện đầu tiên sau vị trí bắt đầu được chỉ định):
SELECT
REGEXP_SUBSTR('My dogs have dags', 'd.g', 8, 1)
FROM DUAL;
Kết quả:
dag
Phân biệt chữ hoa chữ thường
REGEXP_SUBSTR()
hàm tuân theo các quy tắc xác định đối chiếu và dẫn xuất của Oracle, quy tắc này xác định đối chiếu sẽ sử dụng khi khớp chuỗi với mẫu.
Tuy nhiên, bạn có thể chỉ định rõ ràng phân biệt chữ hoa chữ thường với đối số thứ năm tùy chọn. Khi bạn làm điều này, nó sẽ ghi đè bất kỳ phân biệt chữ hoa chữ thường hoặc độ nhạy trọng âm nào của đối chiếu đã xác định.
Bạn có thể chỉ định i
để đối sánh không phân biệt chữ hoa chữ thường và c
để đối sánh phân biệt chữ hoa chữ thường.
Đây là một ví dụ:
SELECT
REGEXP_SUBSTR('My Cats', 'c.t', 1, 1) AS "Default",
REGEXP_SUBSTR('My Cats', 'c.t', 1, 1, 'i') AS "Case Insensitive",
REGEXP_SUBSTR('My Cats', 'c.t', 1, 1, 'c') AS "Case Sensitive"
FROM DUAL;
Kết quả:
Default Case Insensitive Case Sensitive __________ ___________________ _________________ null Cat null
Đối chiếu của tôi dường như phân biệt chữ hoa chữ thường, dựa trên những kết quả này. Hai chuỗi còn lại buộc phải đối sánh không phân biệt chữ hoa chữ thường và phân biệt chữ hoa chữ thường.
Subexpressions
Dưới đây là một ví dụ về việc sử dụng đối số thứ sáu để trả về một mẫu biểu thức con cụ thể:
SELECT REGEXP_SUBSTR(
'catdogcow',
'(c.t)(d.g)(c.w)',
1, 1, 'i', 1
)
FROM DUAL;
Kết quả:
cat
Trong trường hợp này, tôi đã trả lại biểu thức con đầu tiên.
Đây là những gì sẽ xảy ra nếu tôi chỉ định biểu thức con thứ ba:
SELECT REGEXP_SUBSTR(
'catdogcow',
'(c.t)(d.g)(c.w)',
1, 1, 'i', 3
)
FROM DUAL;
Kết quả:
cow
Đối số rỗng
Nếu bất kỳ đối số nào là null
, kết quả là null
:
SET NULL 'null';
SELECT
REGEXP_SUBSTR(null, 'c.t', 1, 1, 'i', 1) AS "1",
REGEXP_SUBSTR('Cat', null, 1, 1, 'i', 1) AS "2",
REGEXP_SUBSTR('Cat', 'c.t', null, 1, 'i', 1) AS "3",
REGEXP_SUBSTR('Cat', 'c.t', 1, null, 'i', 1) AS "4",
REGEXP_SUBSTR('Cat', 'c.t', 1, 1, null, 1) AS "5",
REGEXP_SUBSTR('Cat', 'c.t', 1, 1, 'i', null) AS "6"
FROM DUAL;
Kết quả:
1 2 3 4 5 6 _______ _______ _______ _______ _______ _______ null null null null null null
Số lượng đối số sai
Không chuyển đối số nào cho hàm hoặc quá ít, dẫn đến lỗi:
SELECT REGEXP_SUBSTR()
FROM DUAL;
Kết quả:
Error starting at line : 1 in command - SELECT REGEXP_SUBSTR() FROM DUAL Error at Command Line : 1 Column : 8 Error report - SQL Error: ORA-00938: not enough arguments for function 00938. 00000 - "not enough arguments for function" *Cause: *Action:
Điều tương tự cũng áp dụng khi chúng ta chuyển quá nhiều đối số:
SELECT REGEXP_SUBSTR('Cat', 'c.t', 1, 1, 'i', 1, 'oops')
FROM DUAL;
Kết quả:
Error starting at line : 1 in command - SELECT REGEXP_SUBSTR('Cat', 'c.t', 1, 1, 'i', 1, 'oops') FROM DUAL Error at Command Line : 1 Column : 8 Error report - SQL Error: ORA-00939: too many arguments for function 00939. 00000 - "too many arguments for function" *Cause: *Action:
Thông tin thêm
REGEXP_SUBSTR()
hàm (cũng như cách triển khai các biểu thức chính quy khác của Oracle) tuân theo tiêu chuẩn biểu thức chính quy IEEE Portable Operating System Interface (POSIX) và các Nguyên tắc về Cụm từ Thông dụng Unicode của Unicode Consortium.
Xem tài liệu Oracle để biết thêm thông tin và ví dụ về REGEXP_SUBSTR()
chức năng.