]> git.saurik.com Git - apple/icu.git/blobdiff - icuSources/test/cintltst/usettest.c
ICU-8.11.tar.gz
[apple/icu.git] / icuSources / test / cintltst / usettest.c
index 03302df236bb2913334132afc1d216bd9cebcee9..d0d5656ebfa545e2513910a71a4810d267d1f455 100644 (file)
@@ -1,10 +1,8 @@
 /*
 **********************************************************************
-* Copyright (c) 2002-2003, International Business Machines
+* Copyright (c) 2002-2005, International Business Machines
 * Corporation and others.  All Rights Reserved.
 **********************************************************************
-* $Source: /cvs/root/ICU/icuSources/test/cintltst/usettest.c,v $ 
-**********************************************************************
 */
 #include "unicode/uset.h"
 #include "unicode/ustring.h"
@@ -19,6 +17,8 @@
 static void TestAPI(void);
 static void Testj2269(void);
 static void TestSerialized(void);
+static void TestNonInvariantPattern(void);
+static void TestBadPattern(void);
 
 void addUSetTest(TestNode** root);
 
@@ -38,6 +38,8 @@ addUSetTest(TestNode** root) {
     TEST(TestAPI);
     TEST(Testj2269);
     TEST(TestSerialized);
+    TEST(TestNonInvariantPattern);
+    TEST(TestBadPattern);
 }
 
 /*------------------------------------------------------------------
@@ -57,6 +59,12 @@ static void Testj2269() {
 static const UChar PAT[] = {91,97,45,99,123,97,98,125,93,0}; /* "[a-c{ab}]" */
 static const int32_t PAT_LEN = (sizeof(PAT) / sizeof(PAT[0])) - 1;
 
+static const UChar PAT_lb[] = {0x6C, 0x62, 0}; /* "lb" */
+static const int32_t PAT_lb_LEN = (sizeof(PAT_lb) / sizeof(PAT_lb[0])) - 1;
+
+static const UChar VAL_SP[] = {0x53, 0x50, 0}; /* "SP" */
+static const int32_t VAL_SP_LEN = (sizeof(VAL_SP) / sizeof(VAL_SP[0])) - 1;
+
 static const UChar STR_bc[] = {98,99,0}; /* "bc" */
 static const int32_t STR_bc_LEN = (sizeof(STR_bc) / sizeof(STR_bc[0])) - 1;
 
@@ -68,6 +76,7 @@ static const int32_t STR_ab_LEN = (sizeof(STR_ab) / sizeof(STR_ab[0])) - 1;
  */
 static void TestAPI() {
     USet* set;
+    USet* set2;
     UErrorCode ec;
     
     /* [] */
@@ -85,9 +94,12 @@ static void TestAPI() {
     ec = U_ZERO_ERROR;
     set = uset_openPattern(PAT, PAT_LEN, &ec);
     if(U_FAILURE(ec)) {
-        log_data_err("uset_openPattern([a-c{ab}]) failed - %s\n", u_errorName(ec));
+        log_err("uset_openPattern([a-c{ab}]) failed - %s\n", u_errorName(ec));
         return;
     }
+    if(!uset_resemblesPattern(PAT, PAT_LEN, 0)) {
+        log_err("uset_resemblesPattern of PAT failed\n");
+    }
     expect(set, "abc{ab}", "def{bc}", &ec);
 
     /* [a-d{ab}] */
@@ -116,7 +128,78 @@ static void TestAPI() {
     uset_removeRange(set, 0x0050, 0x0063);
     expect(set, "de{bc}", "bcfg{ab}", NULL);
 
+    /* [g-l] */
+    uset_set(set, 0x0067, 0x006C);
+    expect(set, "ghijkl", "de{bc}", NULL);
+
+    if (uset_indexOf(set, 0x0067) != 0) {
+        log_err("uset_indexOf failed finding correct index of 'g'\n");
+    }
+
+    if (uset_charAt(set, 0) != 0x0067) {
+        log_err("uset_charAt failed finding correct char 'g' at index 0\n");
+    }
+
+    /* How to test this one...? */
+    uset_compact(set);
+
+    /* [g-i] */
+    uset_retain(set, 0x0067, 0x0069);
+    expect(set, "ghi", "dejkl{bc}", NULL);
+
+    /* UCHAR_ASCII_HEX_DIGIT */
+    uset_applyIntPropertyValue(set, UCHAR_ASCII_HEX_DIGIT, 1, &ec);
+    if(U_FAILURE(ec)) {
+        log_err("uset_applyIntPropertyValue([UCHAR_ASCII_HEX_DIGIT]) failed - %s\n", u_errorName(ec));
+        return;
+    }
+    expect(set, "0123456789ABCDEFabcdef", "GHIjkl{bc}", NULL);
+
+    /* [ab] */
+    uset_clear(set);
+    uset_addAllCodePoints(set, STR_ab, STR_ab_LEN);
+    expect(set, "ab", "def{ab}", NULL);
+    if (uset_containsAllCodePoints(set, STR_bc, STR_bc_LEN)){
+        log_err("set should not conatin all characters of \"bc\" \n");
+    }
+
+    /* [] */
+    set2 = uset_open(1, 1);
+    uset_clear(set2);
+
+    /* space */
+    uset_applyPropertyAlias(set2, PAT_lb, PAT_lb_LEN, VAL_SP, VAL_SP_LEN, &ec);
+    expect(set2, " ", "abcdefghi{bc}", NULL);
+
+    /* [a-c] */
+    uset_set(set2, 0x0061, 0x0063);
+    /* [g-i] */
+    uset_set(set, 0x0067, 0x0069);
+
+    /* [a-c g-i] */
+    if (uset_containsSome(set, set2)) {
+        log_err("set should not contain some of set2 yet\n");
+    }
+    uset_complementAll(set, set2);
+    if (!uset_containsSome(set, set2)) {
+        log_err("set should contain some of set2\n");
+    }
+    expect(set, "abcghi", "def{bc}", NULL);
+
+    /* [g-i] */
+    uset_removeAll(set, set2);
+    expect(set, "ghi", "abcdef{bc}", NULL);
+
+    /* [a-c g-i] */
+    uset_addAll(set2, set);
+    expect(set2, "abcghi", "def{bc}", NULL);
+
+    /* [g-i] */
+    uset_retainAll(set2, set);
+    expect(set2, "ghi", "abcdef{bc}", NULL);
+
     uset_close(set);
+    uset_close(set2);
 }
 
 /*------------------------------------------------------------------
@@ -159,14 +242,18 @@ static void expectContainment(const USet* set,
                               const char* list,
                               UBool isIn) {
     const char* p = list;
-    UChar ustr[128];
-    char pat[128];
+    UChar ustr[4096];
+    char *pat;
     UErrorCode ec;
-    int32_t rangeStart = -1, rangeEnd = -1;
+    int32_t rangeStart = -1, rangeEnd = -1, length;
             
     ec = U_ZERO_ERROR;
-    uset_toPattern(set, ustr, sizeof(ustr), TRUE, &ec);
-    u_UCharsToChars(ustr, pat, u_strlen(ustr)+1);
+    length = uset_toPattern(set, ustr, sizeof(ustr), TRUE, &ec);
+    if(U_FAILURE(ec)) {
+        log_err("FAIL: uset_toPattern() fails in expectContainment() - %s\n", u_errorName(ec));
+        return;
+    }
+    pat=aescstrdup(ustr, length);
 
     while (*p) {
         if (*p=='{') {
@@ -174,8 +261,9 @@ static void expectContainment(const USet* set,
             int32_t stringLength = 0;
             char strCopy[64];
 
-            while (*p++ != '}') {}
-            stringLength = p - stringStart - 1;
+            while (*p++ != '}') {
+            }
+            stringLength = (int32_t)(p - stringStart - 1);
             strncpy(strCopy, stringStart, stringLength);
             strCopy[stringLength] = 0;
 
@@ -243,7 +331,7 @@ static void expectContainment(const USet* set,
     }
 }
 
-/* This only works for BMP chars */
+/* This only works for invariant BMP chars */
 static char oneUCharToChar(UChar32 c) {
     UChar ubuf[1];
     char buf[1];
@@ -255,22 +343,23 @@ static char oneUCharToChar(UChar32 c) {
 static void expectItems(const USet* set,
                         const char* items) {
     const char* p = items;
-    UChar ustr[128], itemStr[128];
-    char pat[128], buf[128];
+    UChar ustr[4096], itemStr[4096];
+    char buf[4096];
+    char *pat;
     UErrorCode ec;
     int32_t expectedSize = 0;
     int32_t itemCount = uset_getItemCount(set);
     int32_t itemIndex = 0;
     UChar32 start = 1, end = 0;
-    int32_t itemLen = 0;
+    int32_t itemLen = 0, length;
 
     ec = U_ZERO_ERROR;
-    uset_toPattern(set, ustr, sizeof(ustr), TRUE, &ec);
+    length = uset_toPattern(set, ustr, sizeof(ustr), TRUE, &ec);
     if (U_FAILURE(ec)) {
         log_err("FAIL: uset_toPattern => %s\n", u_errorName(ec));
         return;
     }
-    u_UCharsToChars(ustr, pat, u_strlen(ustr)+1);
+    pat=aescstrdup(ustr, length);
 
     if (uset_isEmpty(set) != (strlen(items)==0)) {
         log_err("FAIL: %s should return %s from isEmpty\n",
@@ -279,7 +368,7 @@ static void expectItems(const USet* set,
     }
 
     /* Don't test patterns starting with "[^" */
-    if (strlen(pat) > 2 && pat[1] == '^') {
+    if (u_strlen(ustr) > 2 && ustr[1] == 0x5e /*'^'*/) {
         return;
     }
 
@@ -319,8 +408,9 @@ static void expectItems(const USet* set,
             int32_t stringLength = 0;
             char strCopy[64];
 
-            while (*p++ != '}') {}
-            stringLength = p - stringStart - 1;
+            while (*p++ != '}') {
+            }
+            stringLength = (int32_t)(p - stringStart - 1);
             strncpy(strCopy, stringStart, stringLength);
             strCopy[stringLength] = 0;
 
@@ -386,7 +476,7 @@ TestSerialized() {
     errorCode=U_ZERO_ERROR;
     set=uset_openPattern(pattern, -1, &errorCode);
     if(U_FAILURE(errorCode)) {
-        log_data_err("uset_openPattern([:Cf:]) failed - %s\n", u_errorName(errorCode));
+        log_err("uset_openPattern([:Cf:]) failed - %s\n", u_errorName(errorCode));
         return;
     }
 
@@ -408,4 +498,35 @@ TestSerialized() {
     uset_close(set);
 }
 
+/**
+ * Make sure that when non-invariant chars are passed to uset_openPattern
+ * they do not cause an ugly failure mode (e.g. assertion failure).
+ * JB#3795.
+ */
+static void
+TestNonInvariantPattern() {
+    UErrorCode ec = U_ZERO_ERROR;
+    /* The critical part of this test is that the following pattern
+       must contain a non-invariant character. */
+    static const char *pattern = "[:ccc!=0:]";
+    UChar buf[256];
+    int32_t len = u_unescape(pattern, buf, 256);
+    /* This test 'fails' by having an assertion failure within the
+       following call.  It passes by running to completion with no
+       assertion failure. */
+    USet *set = uset_openPattern(buf, len, &ec);
+    uset_close(set);
+}
+
+static void TestBadPattern(void) {
+    UErrorCode status = U_ZERO_ERROR;
+    USet *pat;
+    U_STRING_DECL(pattern, "[", 1);
+    U_STRING_INIT(pattern, "[", 1);
+    pat = uset_openPatternOptions(pattern, u_strlen(pattern), 0, &status);
+    if (pat != NULL || U_SUCCESS(status)) {
+        log_err("uset_openPatternOptions did not fail as expected %s\n", u_errorName(status));
+    }
+}
+
 /*eof*/