]> git.saurik.com Git - apple/icu.git/blobdiff - icuSources/tools/genren/genren.pl
ICU-66108.tar.gz
[apple/icu.git] / icuSources / tools / genren / genren.pl
old mode 100644 (file)
new mode 100755 (executable)
index ddf7878..f85b96a
@@ -1,12 +1,14 @@
 #!/usr/bin/perl 
+# Copyright (C) 2016 and later: Unicode, Inc. and others.
+# License & terms of use: http://www.unicode.org/copyright.html
 #*
 #*******************************************************************************
-#*   Copyright (C) 2001-2004, International Business Machines
+#*   Copyright (C) 2001-2012, International Business Machines
 #*   Corporation and others.  All Rights Reserved.
 #*******************************************************************************
 #*
 #*   file name:  genren.pl
-#*   encoding:   US-ASCII
+#*   encoding:   UTF-8
 #*   tab size:   8 (not used)
 #*   indentation:4
 #*
 #*  Used to generate renaming headers.
 #*  Run on UNIX platforms (linux) in order to catch all the exports
 
+use POSIX qw(strftime);
+
 $headername = 'urename.h';
 
 $path = substr($0, 0, rindex($0, "/")+1)."../../common/unicode/uversion.h";
 
+$nmopts = '-Cg -f s';
+$post = '';
+
+$mode = 'POSIX';
+
 (-e $path) || die "Cannot find uversion.h";
 
 open(UVERSION, $path);
@@ -38,6 +47,9 @@ while($ARGV[0] =~ /^-/) { # detects whether there are any arguments
     /^-v/ && ($VERBOSE++, next);                      # verbose
     /^-h/ && (&printHelpMsgAndExit, next);               # help
     /^-o/ && (($headername = shift (@ARGV)), next);   # output file
+    /^-n/ && (($nmopts = shift (@ARGV)), next);   # nm opts
+    /^-p/ && (($post = shift (@ARGV)), next);   # nm opts
+    /^-x/ && (($mode = shift (@ARGV)), next);   # nm opts
     /^-S/ && (($U_ICU_VERSION_SUFFIX = shift(@ARGV)), next); # pick the suffix
     warn("Invalid option $_\n");
     &printHelpMsgAndExit;
@@ -57,19 +69,22 @@ $HEADERDEF =~ s/\./_/;
     open HEADER, ">$headername"; # opening a header file
 
 #We will print our copyright here + warnings
+
 print HEADER <<"EndOfHeaderComment";
+// © 2016 and later: Unicode, Inc. and others.
+// License & terms of use: http://www.unicode.org/copyright.html
 /*
 *******************************************************************************
-*   Copyright (C) 2002-2004, International Business Machines
+*   Copyright (C) 2002-2016, International Business Machines
 *   Corporation and others.  All Rights Reserved.
 *******************************************************************************
 *
 *   file name:  $headername
-*   encoding:   US-ASCII
+*   encoding:   UTF-8
 *   tab size:   8 (not used)
 *   indentation:4
 *
-*   Created by: Perl script written by Vladimir Weinstein
+*   Created by: Perl script tools/genren.pl written by Vladimir Weinstein
 *
 *  Contains data for renaming ICU exports.
 *  Gets included by umachine.h
@@ -81,46 +96,126 @@ print HEADER <<"EndOfHeaderComment";
 #ifndef $HEADERDEF
 #define $HEADERDEF
 
-/* Uncomment the following line to disable renaming on platforms
-   that do not use Autoconf. */
-/* #define U_DISABLE_RENAMING 1 */
+/* U_DISABLE_RENAMING can be defined in the following ways:
+ *   - when running configure, e.g.
+ *        runConfigureICU Linux --disable-renaming
+ *   - by changing the default setting of U_DISABLE_RENAMING in uconfig.h
+ */
+
+#include "unicode/uconfig.h"
 
 #if !U_DISABLE_RENAMING
+
+// Disable Renaming for Visual Studio's IntelliSense feature, so that 'Go-to-Definition' (F12) will work.
+#if !(defined(_MSC_VER) && defined(__INTELLISENSE__))
+
+/* We need the U_ICU_ENTRY_POINT_RENAME definition. There's a default one in unicode/uvernum.h we can use, but we will give
+   the platform a chance to define it first.
+   Normally (if utypes.h or umachine.h was included first) this will not be necessary as it will already be defined.
+ */
+
+#ifndef U_ICU_ENTRY_POINT_RENAME
+#include "unicode/umachine.h"
+#endif
+
+/* If we still don't have U_ICU_ENTRY_POINT_RENAME use the default. */
+#ifndef U_ICU_ENTRY_POINT_RENAME
+#include "unicode/uvernum.h"
+#endif
+
+/* Error out before the following defines cause very strange and unexpected code breakage */
+#ifndef U_ICU_ENTRY_POINT_RENAME
+#error U_ICU_ENTRY_POINT_RENAME is not defined - cannot continue. Consider defining U_DISABLE_RENAMING if renaming should not be used.
+#endif
+
 EndOfHeaderComment
 
+$fileCount = 0;
+$itemCount = 0;
+$symbolCount = 0;
+
 for(;@ARGV; shift(@ARGV)) {
-    @NMRESULT = `nm -Cg -f s $ARGV[0]`;
+    $fileCount++;
+    @NMRESULT = `nm $nmopts $ARGV[0] $post`;
     if($?) {
         warn "Couldn't do 'nm' for $ARGV[0], continuing...\n";
         next; # Couldn't do nm for the file
     }
-    splice @NMRESULT, 0, 6;
-    
+    if($mode =~ /POSIX/) {
+        splice @NMRESULT, 0, 6;
+    } elsif ($mode =~ /Mach-O/) {
+#        splice @NMRESULT, 0, 10;
+    }
     foreach (@NMRESULT) { # Process every line of result and stuff it in $_
-        ($_, $address, $type) = split(/\|/);
+        $itemCount++;
+        if($mode =~ /POSIX/) {
+            &verbose("  $_");
+            ($_, $address, $type) = split(/\|/);
+            chop $qtype;
+        } elsif ($mode =~ /Mach-O/) {
+            ($address, $type, $_) = split(/ /);
+            if(/^_(.*)$/) {
+                $_ = $1;
+            } else {
+                next;
+            }
+        } else {
+            die "Unknown mode $mode";
+        }
         &verbose( "type: \"$type\" ");
         if(!($type =~ /[UAwW?]/)) {
             if(/@@/) { # These would be imports
                 &verbose( "Import: $_ \"$type\"\n");
-            } elsif (/::/) { # C++ methods, stuff class name in associative array
                 &verbose( "C++ method: $_\n");
-                ## icu_2_0::CharString::~CharString(void) -> CharString
+            } elsif (/^[^\(]*::/) { # C++ methods, stuff class name in associative array
+               ##  DON'T match    ...  (   foo::bar ...   want :: to be to the left of paren
+                ## icu::CharString::~CharString(void) -> CharString
                 @CppName = split(/::/); ## remove scope stuff
+                
                 if(@CppName>1) {
                     ## MessageFormat virtual table -> MessageFormat
+                    if(! ($CppName[0] =~ /icu/ )) {
+                        # *** WARNING Bad namespace (not 'icu') on ShoeSize::ShoeSize()
+                        warn "*** WARNING Bad namespace (not 'icu') on $_\n";
+                        next;
+                    }
+                    &verbose ( "(Chopping scope $CppName[0] )");
                     @CppName = split(/ /, $CppName[1]); ## remove debug stuff
                 }
                 ## ures_getUnicodeStringByIndex(UResourceBundle -> ures_getUnicodeStringByIndex
                 @CppName = split(/\(/, $CppName[0]); ## remove function args
-                $CppClasses{$CppName[0]}++;
+                if($CppName[0] =~ /^operator/) {
+                    &verbose ("Skipping C++ function: $_\n");
+                } elsif($CppName[0] =~ /^~/) {
+                    &verbose ("Skipping C++ destructor: $_\n");
+                } else {
+                    &verbose( "Skipping C++ class: '$CppName[0]': $_ \n");
+                    # $CppClasses{$CppName[0]}++;
+                    # $symbolCount++;
+                }
+           } elsif ( my ($cfn) = m/^([A-Za-z0-9_]*)\(.*/ ) {
+               &verbose ( "$ARGV[0]:  got global C++ function  $cfn with '$_'\n" );
+                $CFuncs{$cfn}++;
+               $symbolCount++;
             } elsif ( /\(/) { # These are strange functions
-                print STDERR "$_\n";
+                print STDERR "$ARGV[0]: Not sure what to do with '$_'\n";
+           } elsif ( /^_init/ ) {
+               &verbose( "$ARGV[0]: Skipped initializer $_\n" );
+           } elsif ( /^_fini/ ) {
+               &verbose( "$ARGV[0]: Skipped finilizer $_\n" );
             } elsif ( /icu_/) {
-                print STDERR "Skipped strange mangled function $_\n";
+                print STDERR "$ARGV[0]: Skipped strange mangled function $_\n";
+            } elsif ( /^vtable for /) {
+                print STDERR "$ARGV[0]: Skipped vtable $_\n";
+            } elsif ( /^typeinfo/) {
+                print STDERR "$ARGV[0]: Skipped typeinfo $_\n";
+            } elsif ( /operator\+/ ) {
+                print STDERR "$ARGV[0]: Skipped ignored function $_\n";
             } else { # This is regular C function 
                 &verbose( "C func: $_\n");
                 @funcname = split(/[\(\s+]/);
                 $CFuncs{$funcname[0]}++;
+               $symbolCount++;
             }
         } else {
             &verbose( "Skipped: $_ $1\n");
@@ -128,21 +223,31 @@ for(;@ARGV; shift(@ARGV)) {
     }
 }
 
+if( $fileCount == 0 ) {
+  die "Error: $itemCount lines from $fileCount files processed, but $symbolCount symbols were found.\n";
+}
+
+if( $symbolCount == 0 ) {
+  die "Error: $itemCount lines from $fileCount files processed, but $symbolCount symbols were found.\n";
+}
+
+print " Loaded $symbolCount symbols from $itemCount lines in $fileCount files.\n";
+
 print HEADER "\n/* C exports renaming data */\n\n";
 foreach(sort keys(%CFuncs)) {
-    print HEADER "#define $_ $_$U_ICU_VERSION_SUFFIX\n";
+    print HEADER "#define $_ U_ICU_ENTRY_POINT_RENAME($_)\n";
+#    print HEADER "#define $_ $_$U_ICU_VERSION_SUFFIX\n";
 }
 
-print HEADER "/* C++ class names renaming defines */\n\n";
-print HEADER "#ifdef XP_CPLUSPLUS\n";
-print HEADER "#if !U_HAVE_NAMESPACE\n\n";
-foreach(sort keys(%CppClasses)) {
-    print HEADER "#define $_ $_$U_ICU_VERSION_SUFFIX\n";
-}
-print HEADER "\n#endif\n";
-print HEADER "#endif\n";
-print HEADER "\n#endif\n";
-print HEADER "\n#endif\n";
+
+print HEADER <<"EndOfHeaderFooter";
+
+#endif /* !(defined(_MSC_VER) && defined(__INTELLISENSE__)) */
+#endif /* U_DISABLE_RENAMING */
+#endif /* URENAME_H */
+
+EndOfHeaderFooter
+
 
 close HEADER;
 
@@ -168,4 +273,3 @@ EndHelpText
     exit 0;
 
 }
-