]> git.saurik.com Git - apple/icu.git/blobdiff - icuSources/tools/genren/genren.pl
ICU-62141.0.1.tar.gz
[apple/icu.git] / icuSources / tools / genren / genren.pl
old mode 100644 (file)
new mode 100755 (executable)
index 71c6b45..8859a27
@@ -1,12 +1,14 @@
 #!/usr/bin/perl 
+# Copyright (C) 2016 and later: Unicode, Inc. and others.
+# License & terms of use: http://www.unicode.org/copyright.html
 #*
 #*******************************************************************************
-#*   Copyright (C) 2001-2008, International Business Machines
+#*   Copyright (C) 2001-2012, International Business Machines
 #*   Corporation and others.  All Rights Reserved.
 #*******************************************************************************
 #*
 #*   file name:  genren.pl
-#*   encoding:   US-ASCII
+#*   encoding:   UTF-8
 #*   tab size:   8 (not used)
 #*   indentation:4
 #*
@@ -16,6 +18,8 @@
 #*  Used to generate renaming headers.
 #*  Run on UNIX platforms (linux) in order to catch all the exports
 
+use POSIX qw(strftime);
+
 $headername = 'urename.h';
 
 $path = substr($0, 0, rindex($0, "/")+1)."../../common/unicode/uversion.h";
@@ -23,7 +27,7 @@ $path = substr($0, 0, rindex($0, "/")+1)."../../common/unicode/uversion.h";
 $nmopts = '-Cg -f s';
 $post = '';
 
-$mode = 'LINUX';
+$mode = 'POSIX';
 
 (-e $path) || die "Cannot find uversion.h";
 
@@ -65,19 +69,22 @@ $HEADERDEF =~ s/\./_/;
     open HEADER, ">$headername"; # opening a header file
 
 #We will print our copyright here + warnings
+
 print HEADER <<"EndOfHeaderComment";
+// © 2016 and later: Unicode, Inc. and others.
+// License & terms of use: http://www.unicode.org/copyright.html
 /*
 *******************************************************************************
-*   Copyright (C) 2002-2008, International Business Machines
+*   Copyright (C) 2002-2016, International Business Machines
 *   Corporation and others.  All Rights Reserved.
 *******************************************************************************
 *
 *   file name:  $headername
-*   encoding:   US-ASCII
+*   encoding:   UTF-8
 *   tab size:   8 (not used)
 *   indentation:4
 *
-*   Created by: Perl script written by Vladimir Weinstein
+*   Created by: Perl script tools/genren.pl written by Vladimir Weinstein
 *
 *  Contains data for renaming ICU exports.
 *  Gets included by umachine.h
@@ -89,14 +96,43 @@ print HEADER <<"EndOfHeaderComment";
 #ifndef $HEADERDEF
 #define $HEADERDEF
 
-/* Uncomment the following line to disable renaming on platforms
-   that do not use Autoconf. */
-/* #define U_DISABLE_RENAMING 1 */
+/* U_DISABLE_RENAMING can be defined in the following ways:
+ *   - when running configure, e.g.
+ *        runConfigureICU Linux --disable-renaming
+ *   - by changing the default setting of U_DISABLE_RENAMING in uconfig.h
+ */
+
+#include "unicode/uconfig.h"
 
 #if !U_DISABLE_RENAMING
+
+/* We need the U_ICU_ENTRY_POINT_RENAME definition. There's a default one in unicode/uvernum.h we can use, but we will give
+   the platform a chance to define it first.
+   Normally (if utypes.h or umachine.h was included first) this will not be necessary as it will already be defined.
+ */
+
+#ifndef U_ICU_ENTRY_POINT_RENAME
+#include "unicode/umachine.h"
+#endif
+
+/* If we still don't have U_ICU_ENTRY_POINT_RENAME use the default. */
+#ifndef U_ICU_ENTRY_POINT_RENAME
+#include "unicode/uvernum.h"
+#endif
+
+/* Error out before the following defines cause very strange and unexpected code breakage */
+#ifndef U_ICU_ENTRY_POINT_RENAME
+#error U_ICU_ENTRY_POINT_RENAME is not defined - cannot continue. Consider defining U_DISABLE_RENAMING if renaming should not be used.
+#endif
+
 EndOfHeaderComment
 
+$fileCount = 0;
+$itemCount = 0;
+$symbolCount = 0;
+
 for(;@ARGV; shift(@ARGV)) {
+    $fileCount++;
     @NMRESULT = `nm $nmopts $ARGV[0] $post`;
     if($?) {
         warn "Couldn't do 'nm' for $ARGV[0], continuing...\n";
@@ -108,11 +144,15 @@ for(;@ARGV; shift(@ARGV)) {
 #        splice @NMRESULT, 0, 10;
     }
     foreach (@NMRESULT) { # Process every line of result and stuff it in $_
+        $itemCount++;
         if($mode =~ /POSIX/) {
+            &verbose("  $_");
             ($_, $address, $type) = split(/\|/);
+            chop $qtype;
         } elsif ($mode =~ /Mach-O/) {
-            if(/^(?:[0-9a-fA-F]){8} ([A-Z]) (?:_)?(.*)$/) {
-                ($_, $type) = ($2, $1);
+            ($address, $type, $_) = split(/ /);
+            if(/^_(.*)$/) {
+                $_ = $1;
             } else {
                 next;
             }
@@ -123,12 +163,20 @@ for(;@ARGV; shift(@ARGV)) {
         if(!($type =~ /[UAwW?]/)) {
             if(/@@/) { # These would be imports
                 &verbose( "Import: $_ \"$type\"\n");
-            } elsif (/::/) { # C++ methods, stuff class name in associative array
                 &verbose( "C++ method: $_\n");
-                ## icu_2_0::CharString::~CharString(void) -> CharString
+            } elsif (/^[^\(]*::/) { # C++ methods, stuff class name in associative array
+               ##  DON'T match    ...  (   foo::bar ...   want :: to be to the left of paren
+                ## icu::CharString::~CharString(void) -> CharString
                 @CppName = split(/::/); ## remove scope stuff
+                
                 if(@CppName>1) {
                     ## MessageFormat virtual table -> MessageFormat
+                    if(! ($CppName[0] =~ /icu/ )) {
+                        # *** WARNING Bad namespace (not 'icu') on ShoeSize::ShoeSize()
+                        warn "*** WARNING Bad namespace (not 'icu') on $_\n";
+                        next;
+                    }
+                    &verbose ( "(Chopping scope $CppName[0] )");
                     @CppName = split(/ /, $CppName[1]); ## remove debug stuff
                 }
                 ## ures_getUnicodeStringByIndex(UResourceBundle -> ures_getUnicodeStringByIndex
@@ -138,22 +186,33 @@ for(;@ARGV; shift(@ARGV)) {
                 } elsif($CppName[0] =~ /^~/) {
                     &verbose ("Skipping C++ destructor: $_\n");
                 } else {
-                    $CppClasses{$CppName[0]}++;
+                    &verbose( "Skipping C++ class: '$CppName[0]': $_ \n");
+                    # $CppClasses{$CppName[0]}++;
+                    # $symbolCount++;
                 }
+           } elsif ( my ($cfn) = m/^([A-Za-z0-9_]*)\(.*/ ) {
+               &verbose ( "$ARGV[0]:  got global C++ function  $cfn with '$_'\n" );
+                $CFuncs{$cfn}++;
+               $symbolCount++;
             } elsif ( /\(/) { # These are strange functions
-                print STDERR "$_\n";
+                print STDERR "$ARGV[0]: Not sure what to do with '$_'\n";
+           } elsif ( /^_init/ ) {
+               &verbose( "$ARGV[0]: Skipped initializer $_\n" );
+           } elsif ( /^_fini/ ) {
+               &verbose( "$ARGV[0]: Skipped finilizer $_\n" );
             } elsif ( /icu_/) {
-                print STDERR "Skipped strange mangled function $_\n";
+                print STDERR "$ARGV[0]: Skipped strange mangled function $_\n";
             } elsif ( /^vtable for /) {
-                print STDERR "Skipped vtable $_\n";
-            } elsif ( /^typeinfo for /) {
-                print STDERR "Skipped typeinfo $_\n";
+                print STDERR "$ARGV[0]: Skipped vtable $_\n";
+            } elsif ( /^typeinfo/) {
+                print STDERR "$ARGV[0]: Skipped typeinfo $_\n";
             } elsif ( /operator\+/ ) {
-                print STDERR "Skipped ignored function $_\n";
+                print STDERR "$ARGV[0]: Skipped ignored function $_\n";
             } else { # This is regular C function 
                 &verbose( "C func: $_\n");
                 @funcname = split(/[\(\s+]/);
                 $CFuncs{$funcname[0]}++;
+               $symbolCount++;
             }
         } else {
             &verbose( "Skipped: $_ $1\n");
@@ -161,19 +220,22 @@ for(;@ARGV; shift(@ARGV)) {
     }
 }
 
+if( $fileCount == 0 ) {
+  die "Error: $itemCount lines from $fileCount files processed, but $symbolCount symbols were found.\n";
+}
+
+if( $symbolCount == 0 ) {
+  die "Error: $itemCount lines from $fileCount files processed, but $symbolCount symbols were found.\n";
+}
+
+print " Loaded $symbolCount symbols from $itemCount lines in $fileCount files.\n";
+
 print HEADER "\n/* C exports renaming data */\n\n";
 foreach(sort keys(%CFuncs)) {
-    print HEADER "#define $_ $_$U_ICU_VERSION_SUFFIX\n";
+    print HEADER "#define $_ U_ICU_ENTRY_POINT_RENAME($_)\n";
+#    print HEADER "#define $_ $_$U_ICU_VERSION_SUFFIX\n";
 }
 
-print HEADER "/* C++ class names renaming defines */\n\n";
-print HEADER "#ifdef XP_CPLUSPLUS\n";
-print HEADER "#if !U_HAVE_NAMESPACE\n\n";
-foreach(sort keys(%CppClasses)) {
-    print HEADER "#define $_ $_$U_ICU_VERSION_SUFFIX\n";
-}
-print HEADER "\n#endif\n";
-print HEADER "#endif\n";
 print HEADER "\n#endif\n";
 print HEADER "\n#endif\n";
 
@@ -201,4 +263,3 @@ EndHelpText
     exit 0;
 
 }
-