]> git.saurik.com Git - wxWidgets.git/blobdiff - src/common/txtstrm.cpp
Revert "Make wxMSW stack walking methods work with Unicode identifiers."
[wxWidgets.git] / src / common / txtstrm.cpp
index 100e6ec68984b84062b13c32e41638f04b1094e6..9e3fa8a7934fba0e07fc0366c03363063807ab1f 100644 (file)
@@ -1,18 +1,13 @@
 ///////////////////////////////////////////////////////////////////////////////
-// Name:        txtstrm.cpp
+// Name:        src/common/txtstrm.cpp
 // Purpose:     Text stream classes
 // Author:      Guilhem Lavaux
 // Modified by:
 // Created:     28/06/98
-// RCS-ID:      $Id$
 // Copyright:   (c) Guilhem Lavaux
-// Licence:    wxWindows license
+// Licence:     wxWindows licence
 /////////////////////////////////////////////////////////////////////////////
 
-#ifdef __GNUG__
-#pragma implementation "txtstrm.h"
-#endif
-
 // For compilers that support precompilation, includes "wx.h".
 #include "wx/wxprec.h"
 
 #if wxUSE_STREAMS
 
 #include "wx/txtstrm.h"
-#include <ctype.h>
 
+#ifndef WX_PRECOMP
+    #include "wx/crt.h"
+#endif
 
-// ----------------------------------------------------------------------------
-// constants
-// ----------------------------------------------------------------------------
-
-// Unix: "\n"
-// Dos:  "\r\n"
-// Mac:  "\r"
+#include <ctype.h>
 
 // ----------------------------------------------------------------------------
 // wxTextInputStream
 // ----------------------------------------------------------------------------
 
-wxTextInputStream::wxTextInputStream(wxInputStream& s)
-  : m_input(&s)
+#if wxUSE_UNICODE
+wxTextInputStream::wxTextInputStream(wxInputStream &s,
+                                     const wxString &sep,
+                                     const wxMBConv& conv)
+  : m_input(s), m_separators(sep), m_conv(conv.Clone())
+{
+    memset((void*)m_lastBytes, 0, 10);
+}
+#else
+wxTextInputStream::wxTextInputStream(wxInputStream &s, const wxString &sep)
+  : m_input(s), m_separators(sep)
 {
+    memset((void*)m_lastBytes, 0, 10);
 }
+#endif
 
 wxTextInputStream::~wxTextInputStream()
 {
+#if wxUSE_UNICODE
+    delete m_conv;
+#endif // wxUSE_UNICODE
 }
 
-wxChar wxTextInputStream::NextNonWhiteSpace()
+void wxTextInputStream::UngetLast()
 {
-    wxChar c = (wxChar) 0;
-    for (;;)
-    {
-        c = m_input->GetC();
-       if (!m_input) return (wxChar) 0;
-       
-       if (c != T('\n') &&
-           c != T('\r') &&
-           c != T('\t') &&
-           c != T(' '))
-       {
-           return c;
-       }
-    }
-
-    // this shouldn't happen
-    return (wxChar) 0;
+    size_t byteCount = 0;
+    while(m_lastBytes[byteCount]) // pseudo ANSI strlen (even for Unicode!)
+        byteCount++;
+    m_input.Ungetch(m_lastBytes, byteCount);
+    memset((void*)m_lastBytes, 0, 10);
 }
 
-void wxTextInputStream::SkipIfEndOfLine( wxChar c )
+wxChar wxTextInputStream::NextChar()
 {
-    if (c == T('\n'))
+#if wxUSE_UNICODE
+    wxChar wbuf[2];
+    memset((void*)m_lastBytes, 0, 10);
+    for(size_t inlen = 0; inlen < 9; inlen++)
     {
-        // eat on UNIX
-       return;
-    }
+        // actually read the next character
+        m_lastBytes[inlen] = m_input.GetC();
 
-    if (c == T('\r'))
-    {
-        // eat on both Mac and DOS
-       
-        wxChar c2 = m_input->GetC();
-        if (!m_input) return;
-       
-        if (c2 == T('\n'))
+        if(m_input.LastRead() <= 0)
+            return wxEOT;
+
+        switch ( m_conv->ToWChar(wbuf, WXSIZEOF(wbuf), m_lastBytes, inlen + 1) )
         {
-           // eat on DOS
-           return;
-       }
-        else
-       {
-           // Don't eat on Mac
-            m_input->Ungetch( c2 );
-       }
+            case 0:
+                // this is a bug in converter object as it should either fail
+                // or decode non-empty string to something non-empty
+                wxFAIL_MSG("ToWChar() can't return 0 for non-empty input");
+                break;
+
+            case wxCONV_FAILED:
+                // the buffer probably doesn't contain enough bytes to decode
+                // as a complete character, try with more bytes
+                break;
+
+            default:
+                // if we couldn't decode a single character during the last
+                // loop iteration we shouldn't be able to decode 2 or more of
+                // them with an extra single byte, something fishy is going on
+                wxFAIL_MSG("unexpected decoding result");
+                // fall through nevertheless and return at least something
+
+            case 1:
+                // we finally decoded a character
+                return wbuf[0];
+        }
     }
-    else
+
+    // there should be no encoding which requires more than nine bytes for one
+    // character so something must be wrong with our conversion but we have no
+    // way to signal it from here
+    return wxEOT;
+#else
+    m_lastBytes[0] = m_input.GetC();
+
+    if(m_input.LastRead() <= 0)
+        return wxEOT;
+
+    return m_lastBytes[0];
+#endif
+
+}
+
+wxChar wxTextInputStream::NextNonSeparators()
+{
+    for (;;)
     {
-        // no line terminator
-        m_input->Ungetch( c );
+        wxChar c = NextChar();
+        if (c == wxEOT) return (wxChar) 0;
+
+        if (c != wxT('\n') &&
+            c != wxT('\r') &&
+            m_separators.Find(c) < 0)
+          return c;
     }
+
 }
 
-wxUint32 wxTextInputStream::Read32()
+bool wxTextInputStream::EatEOL(const wxChar &c)
 {
-    /* I only implemented a simple integer parser */
-    int sign;
-    wxInt32 i;
-
-    int c = NextNonWhiteSpace();
-    if (!m_input) return 0;
+    if (c == wxT('\n')) return true; // eat on UNIX
 
-    i = 0;
-    if (! (c == T('-') || c == T('+') || isdigit(c)) )
+    if (c == wxT('\r')) // eat on both Mac and DOS
     {
-        m_input->Ungetch(c);
-        return 0;
-    }
+        wxChar c2 = NextChar();
+        if(c2 == wxEOT) return true; // end of stream reached, had enough :-)
 
-    if (c == T('-'))
-    {
-        sign = -1;
-        c = m_input->GetC();
-    } else
-    if (c == T('+'))
-    {
-        sign = 1;
-        c = m_input->GetC();
-    } else
-    {
-        sign = 1;
+        if (c2 != wxT('\n')) UngetLast(); // Don't eat on Mac
+        return true;
     }
 
-    while (isdigit(c))
-    {
-        i = i*10 + (c - (int)T('0'));
-        c = m_input->GetC();
-    }
+    return false;
+}
+
+wxUint32 wxTextInputStream::Read32(int base)
+{
+    wxASSERT_MSG( !base || (base > 1 && base <= 36), wxT("invalid base") );
+    if(!m_input) return 0;
+
+    wxString word = ReadWord();
+    if(word.empty())
+        return 0;
+    return wxStrtoul(word.c_str(), 0, base);
+}
 
-    SkipIfEndOfLine( c );
+wxUint16 wxTextInputStream::Read16(int base)
+{
+    return (wxUint16)Read32(base);
+}
+
+wxUint8 wxTextInputStream::Read8(int base)
+{
+    return (wxUint8)Read32(base);
+}
 
-    i *= sign;
+wxInt32 wxTextInputStream::Read32S(int base)
+{
+    wxASSERT_MSG( !base || (base > 1 && base <= 36), wxT("invalid base") );
+    if(!m_input) return 0;
 
-    return (wxUint32)i;
+    wxString word = ReadWord();
+    if(word.empty())
+        return 0;
+    return wxStrtol(word.c_str(), 0, base);
 }
 
-wxUint16 wxTextInputStream::Read16()
+wxInt16 wxTextInputStream::Read16S(int base)
 {
-    return (wxUint16)Read32();
+    return (wxInt16)Read32S(base);
 }
 
-wxUint8 wxTextInputStream::Read8()
+wxInt8 wxTextInputStream::Read8S(int base)
 {
-    return (wxUint8)Read32();
+    return (wxInt8)Read32S(base);
 }
 
 double wxTextInputStream::ReadDouble()
 {
-    /* I only implemented a simple float parser */
-    double f;
-    int sign;
+    if(!m_input) return 0;
+    wxString word = ReadWord();
+    if(word.empty())
+        return 0;
+    return wxStrtod(word.c_str(), 0);
+}
 
-    int c = NextNonWhiteSpace();
-    if (!m_input) return 0.0;
+#if WXWIN_COMPATIBILITY_2_6
 
-    f = 0.0;
-    if (! (c == T('.') || c == T('-') || c == T('+') || isdigit(c)) )
-    {
-        m_input->Ungetch(c);
-        return 0.0;
-    }
+wxString wxTextInputStream::ReadString()
+{
+    return ReadLine();
+}
 
-    if (c == T('-'))
-    {
-        sign = -1;
-        c = m_input->GetC();
-    } else
-    if (c == T('+'))
-    {
-        sign = 1;
-        c = m_input->GetC();
-    }
-    else
-    {
-        sign = 1;
-    }
+#endif // WXWIN_COMPATIBILITY_2_6
 
-    while (isdigit(c))
-    {
-        f = f*10 + (c - T('0'));
-        c = m_input->GetC();
-    }
+wxString wxTextInputStream::ReadLine()
+{
+    wxString line;
 
-    if (c == T('.'))
+    while ( !m_input.Eof() )
     {
-        double f_multiplicator = (double) 0.1;
+        wxChar c = NextChar();
+        if(c == wxEOT)
+            break;
 
-        c = m_input->GetC();
+        if (EatEOL(c))
+            break;
 
-        while (isdigit(c))
-       {
-            f += (c-T('0'))*f_multiplicator;
-            f_multiplicator /= 10;
-            c = m_input->GetC();
-        }
+        line += c;
+    }
 
-        if (c == T('e'))
-       {
-            double f_multiplicator = 0.0;
-            int i, e;
+    return line;
+}
 
-            c = m_input->GetC();
+wxString wxTextInputStream::ReadWord()
+{
+    wxString word;
 
-            switch (c)
-           {
-                case T('-'): f_multiplicator = 0.1;  break;
-               case T('+'): f_multiplicator = 10.0; break;
-           }
+    if ( !m_input )
+        return word;
 
-            e = Read8();  // why only max 256 ?
+    wxChar c = NextNonSeparators();
+    if ( !c )
+        return word;
 
-            for (i=0;i<e;i++)
-                f *= f_multiplicator;
-        }
-       else
-           SkipIfEndOfLine( c );
-    }
-    else
-    {
-        m_input->Ungetch(c);
-    }
+    word += c;
 
-    f *= sign;
+    while ( !m_input.Eof() )
+    {
+        c = NextChar();
+        if(c == wxEOT)
+            break;
 
-    return f;
-}
+        if (m_separators.Find(c) >= 0)
+            break;
 
-wxString wxTextInputStream::ReadString()
-{
-    wxChar c;
-    wxString line;
+        if (EatEOL(c))
+            break;
 
-    for (;;)
-    {
-        c = m_input->GetC();
-        if (!m_input) break;
-       
-        if (c == T('\n'))
-        {
-           // eat on UNIX
-           break;
-       }
-       
-        if (c == T('\r'))
-        {
-            // eat on both Mac and DOS
-       
-            wxChar c2 = m_input->GetC();
-           if (!m_input) break;
-       
-           if (c2 == T('\n'))
-            {
-               // eat on DOS
-               break;
-           }
-            else
-           {
-               // Don't eat on Mac
-                m_input->Ungetch( c2 );
-               break;
-           }
-        }
-       
-        line += c;
+        word += c;
     }
 
-    return line;
+    return word;
 }
 
-wxTextInputStream& wxTextInputStream::operator>>(wxString& line)
+wxTextInputStream& wxTextInputStream::operator>>(wxString& word)
 {
-  line = ReadString();
-  return *this;
+    word = ReadWord();
+    return *this;
 }
 
-wxTextInputStream& wxTextInputStream::operator>>(wxChar& c)
+wxTextInputStream& wxTextInputStream::operator>>(char& c)
 {
-    wxChar c1 = m_input->GetC();
-    if (!m_input)
-    {
-        c = (wxChar) 0;
-        return *this;
-    }
+    c = m_input.GetC();
+    if(m_input.LastRead() <= 0) c = 0;
 
-    if (c1 == T('\r'))
-    {
-        c = T('\n');
-        wxChar c2 = m_input->GetC();
-       if (!m_input) return *this;
-       
-       if (c2 != T('\n'))
-       {
-           // we are on a Mac
-            m_input->Ungetch( c2 );
-       }
-    }
-    else
-    {
-        c = c1;
-    }
+    if (EatEOL(c))
+        c = '\n';
 
     return *this;
 }
 
+#if wxUSE_UNICODE && wxWCHAR_T_IS_REAL_TYPE
+
+wxTextInputStream& wxTextInputStream::operator>>(wchar_t& wc)
+{
+    wc = GetChar();
+
+    return *this;
+}
+
+#endif // wxUSE_UNICODE
+
 wxTextInputStream& wxTextInputStream::operator>>(wxInt16& i)
 {
     i = (wxInt16)Read16();
@@ -348,19 +320,53 @@ wxTextInputStream& wxTextInputStream::operator>>(float& f)
     return *this;
 }
 
-wxTextOutputStream::wxTextOutputStream(wxOutputStream& s)
-  : m_output(&s)
+
+
+#if wxUSE_UNICODE
+wxTextOutputStream::wxTextOutputStream(wxOutputStream& s,
+                                       wxEOL mode,
+                                       const wxMBConv& conv)
+  : m_output(s), m_conv(conv.Clone())
+#else
+wxTextOutputStream::wxTextOutputStream(wxOutputStream& s, wxEOL mode)
+  : m_output(s)
+#endif
 {
+    m_mode = mode;
+    if (m_mode == wxEOL_NATIVE)
+    {
+#if defined(__WINDOWS__) || defined(__WXPM__)
+        m_mode = wxEOL_DOS;
+#else
+        m_mode = wxEOL_UNIX;
+#endif
+    }
 }
 
 wxTextOutputStream::~wxTextOutputStream()
 {
+#if wxUSE_UNICODE
+    delete m_conv;
+#endif // wxUSE_UNICODE
+}
+
+void wxTextOutputStream::SetMode(wxEOL mode)
+{
+    m_mode = mode;
+    if (m_mode == wxEOL_NATIVE)
+    {
+#if defined(__WINDOWS__) || defined(__WXPM__)
+        m_mode = wxEOL_DOS;
+#else
+        m_mode = wxEOL_UNIX;
+#endif
+    }
 }
 
 void wxTextOutputStream::Write32(wxUint32 i)
 {
     wxString str;
-    str.Printf(T("%u"), i);
+    str.Printf(wxT("%u"), i);
 
     WriteString(str);
 }
@@ -368,7 +374,7 @@ void wxTextOutputStream::Write32(wxUint32 i)
 void wxTextOutputStream::Write16(wxUint16 i)
 {
     wxString str;
-    str.Printf(T("%u"), i);
+    str.Printf(wxT("%u"), (unsigned)i);
 
     WriteString(str);
 }
@@ -376,7 +382,7 @@ void wxTextOutputStream::Write16(wxUint16 i)
 void wxTextOutputStream::Write8(wxUint8 i)
 {
     wxString str;
-    str.Printf(T("%u"), i);
+    str.Printf(wxT("%u"), (unsigned)i);
 
     WriteString(str);
 }
@@ -385,83 +391,134 @@ void wxTextOutputStream::WriteDouble(double d)
 {
     wxString str;
 
-    str.Printf(T("%f"), d);
+    str.Printf(wxT("%f"), d);
     WriteString(str);
 }
 
 void wxTextOutputStream::WriteString(const wxString& string)
 {
-    for (size_t i = 0; i < string.Len(); i++)
+    size_t len = string.length();
+
+    wxString out;
+    out.reserve(len);
+
+    for ( size_t i = 0; i < len; i++ )
     {
-        wxChar c = string[i];
-        if (c == T('\n'))
+        const wxChar c = string[i];
+        if ( c == wxT('\n') )
         {
-#if   defined(__WINDOWS__)
-            c = T('\r');
-            m_output->Write( (const void*)(&c), sizeof(wxChar) );
-            c = T('\n');
-            m_output->Write( (const void*)(&c), sizeof(wxChar) );
-#elif defined(__UNIX__)
-            c = T('\n');
-            m_output->Write( (const void*)(&c), sizeof(wxChar) );
-#elif defined(__WXMAC__)
-            c = T('\r');
-            m_output->Write( (const void*)(&c), sizeof(wxChar) );
-#elif   defined(__OS2__)
-            c = T('\r');
-            m_output->Write( (const void*)(&c), sizeof(wxChar) );
-            c = T('\n');
-            m_output->Write( (const void*)(&c), sizeof(wxChar) );
+            switch ( m_mode )
+            {
+                case wxEOL_DOS:
+                    out << wxT("\r\n");
+                    continue;
+
+                case wxEOL_MAC:
+                    out << wxT('\r');
+                    continue;
+
+                default:
+                    wxFAIL_MSG( wxT("unknown EOL mode in wxTextOutputStream") );
+                    // fall through
+
+                case wxEOL_UNIX:
+                    // don't treat '\n' specially
+                    ;
+            }
+        }
+
+        out << c;
+    }
+
+#if wxUSE_UNICODE
+    // FIXME-UTF8: use wxCharBufferWithLength if/when we have it
+    wxCharBuffer buffer = m_conv->cWC2MB(out.wc_str(), out.length(), &len);
+    m_output.Write(buffer, len);
 #else
-            #error  "wxTextOutputStream: unsupported platform."
+    m_output.Write(out.c_str(), out.length() );
 #endif
-        }
-        else
-        {
-            m_output->Write( (const void*)(&c), sizeof(wxChar) );
-        }
-   }
 }
 
-wxTextOutputStream& wxTextOutputStream::operator<<(const wxChar *string)
+wxTextOutputStream& wxTextOutputStream::PutChar(wxChar c)
 {
-    WriteString( wxString(string) );
+#if wxUSE_UNICODE
+    WriteString( wxString(&c, *m_conv, 1) );
+#else
+    WriteString( wxString(&c, wxConvLocal, 1) );
+#endif
     return *this;
 }
 
+void wxTextOutputStream::Flush()
+{
+#if wxUSE_UNICODE
+    const size_t len = m_conv->FromWChar(NULL, 0, L"", 1);
+    if ( len > m_conv->GetMBNulLen() )
+    {
+        wxCharBuffer buf(len);
+        m_conv->FromWChar(buf.data(), len, L"", 1);
+        m_output.Write(buf, len - m_conv->GetMBNulLen());
+    }
+#endif // wxUSE_UNICODE
+}
+
 wxTextOutputStream& wxTextOutputStream::operator<<(const wxString& string)
 {
     WriteString( string );
     return *this;
 }
 
-wxTextOutputStream& wxTextOutputStream::operator<<(wxChar c)
+wxTextOutputStream& wxTextOutputStream::operator<<(char c)
 {
-    WriteString( wxString(c) );
+    WriteString( wxString::FromAscii(c) );
+
     return *this;
 }
 
+#if wxUSE_UNICODE && wxWCHAR_T_IS_REAL_TYPE
+
+wxTextOutputStream& wxTextOutputStream::operator<<(wchar_t wc)
+{
+    WriteString( wxString(&wc, *m_conv, 1) );
+
+    return *this;
+}
+
+#endif // wxUSE_UNICODE
+
 wxTextOutputStream& wxTextOutputStream::operator<<(wxInt16 c)
 {
-    Write16( (wxUint16)c );
+    wxString str;
+    str.Printf(wxT("%d"), (signed int)c);
+    WriteString(str);
+
     return *this;
 }
 
 wxTextOutputStream& wxTextOutputStream::operator<<(wxInt32 c)
 {
-    Write32( (wxUint32)c );
+    wxString str;
+    str.Printf(wxT("%ld"), (signed long)c);
+    WriteString(str);
+
     return *this;
 }
 
 wxTextOutputStream& wxTextOutputStream::operator<<(wxUint16 c)
 {
-    Write16(c);
+    wxString str;
+    str.Printf(wxT("%u"), (unsigned int)c);
+    WriteString(str);
+
     return *this;
 }
 
 wxTextOutputStream& wxTextOutputStream::operator<<(wxUint32 c)
 {
-    Write32(c);
+    wxString str;
+    str.Printf(wxT("%lu"), (unsigned long)c);
+    WriteString(str);
+
     return *this;
 }
 
@@ -479,7 +536,7 @@ wxTextOutputStream& wxTextOutputStream::operator<<(float f)
 
 wxTextOutputStream &endl( wxTextOutputStream &stream )
 {
-    return stream << T('\n');
+    return stream.PutChar(wxT('\n'));
 }
 
 #endif